2022飞天技术峰会:硬之城如何基于 SAE 打造数智化电子工业互联网平台

2年前 (2022) 程序员胖胖胖虎阿
170 0 0

全球数字化时代已经到来,数字经济正推动生产方式、生活方式和治理方式的深刻变化,成为重组全球要素资源,重塑经济结构,改变全球竞争格局的关键力量。

云是连接现实与虚拟孪生世界的技术平台,具有广阔的想象空间,作为数字经济的技术方向,云原生技术正在以前所未有的速度成为企业快速发展的关节一环。8月11日,2022 飞天技术峰会在深圳成功举办。硬之城作为阿里云云原生加速器成员企业受邀参会,并由 CEO 李六七发表主题演讲:硬之城云原生转型之路。

2022飞天技术峰会:硬之城如何基于 SAE 打造数智化电子工业互联网平台

本文根据硬之城 CEO 李六七先生在峰会上的分享整理而成。 

背景

硬之城是一家电子产业工业互联网的平台,为包括新能源汽车,工控、医疗、IoT 等十万家企业提供从硬件设计选型到芯片供应,到制造、营销和服务的基于 BOM 的一站式交付。这些硬件设施设计完毕以后,硬之城能够提供 PCBA 项目全生命周期交付。这个过程中,硬之城要把产品设计到输出之间的 2 至 3 个月时间缩短到 2 周。为了实现效率的提升,需要做很多对应数据和技术上面的事情。比如说:

1、硬之城做了行业里面对应芯片领先的产品数据库、商品数据库,以及知识库,这是帮助硬之城在处理方案设计的时候,能够把以前需要人工处理的一个月的时间缩短 90%,也就是是几秒钟的时间再加上人工复核的十分钟。

2、在生产过程中,需要对工厂的整个生产工艺、质量、售后服务进行数字化,所以硬之城才能做到为十万家的硬件公司提供最基础的产品、生产和服务的基础设施。

传统架构面临的问题

2022飞天技术峰会:硬之城如何基于 SAE 打造数智化电子工业互联网平台

在这个过程当中,我们会遇到很多数据和技术的一些问题。比如说传统技术架构遇到三个核心的问题:

第一个是服务器资源占用不平均。当处于资源波峰和波谷的时候,由于负载不均会出现个别服务器压力较大,响应变慢,资源利用效率是较低的。

第二个是运维成本高。以前基于 ECS 的架构,每次做发版升级的时候需要写 Shell 脚本,只有在客户量处于相对低峰的时候会作发版。发版效率低,回滚也很麻烦;出问题的时候排查效率低下,缺少应用级别的监控。

三是操作权限分配繁琐。开发人员和运维人员需要不定期地去登录系统做维护,权限难以收敛,风险较大。

为什么选择 SAE

2022飞天技术峰会:硬之城如何基于 SAE 打造数智化电子工业互联网平台

基于上面提及的这些问题,我们就有了以下几个方案:

1、优化我们的脚本。就是用传统的方式去提升效率,但这个只能缓解问题,不能解决根本的问题,且维护成本高。

2、通过 K8s 容器化来化解问题。但这个对技术的要求更高,有一定的技术陡峭性。虽然硬之城具备较强的技术能力,但我们认为这不是最好的方式。

3、选择 SAE。当接触了阿里云的云原生技术之后,最终选择将我们的 K8s 嫁接到 SAE 基础之上。把新的场景和应用部署在 SAE 上以后,我们发现 SAE 在很多方面给我们带来了很大的提升。比如说在原有架构不变的情况下,我们可以用 0 代码改造的方式,不需要做任何动作,一键可以迁移。第二个是基于云效构建流水线,可以非常简单地完成自动化发布。第三个是不用做机器的登录,而是可以基于权限助手给开发和运维分配权限,将安全性做进一步的提升。当然前面也讲到过 SAE 极具弹性的能力,可以让我们的资源效率变得更高。

2022飞天技术峰会:硬之城如何基于 SAE 打造数智化电子工业互联网平台

SAE 使用实践

可以通过下图来看一下实际情况。

2022飞天技术峰会:硬之城如何基于 SAE 打造数智化电子工业互联网平台

最左图我们可以基于弹性规则给每一个应用配置弹性策略,并且能够观察到每个应用的资源弹性伸缩情况。中间这幅图可以看见的是每个应用的应用监控情况,比如 API 接口调用延迟、慢 SQL 查询等。最右边是关注 TOP 应用情况,比如哪个应用的资源消耗最大,异常请求最多等。作为运维,能够实时可视化地看见每个应用的健康情况,这些能力很好的减轻了运维的负担,尤其是 SAE 还支持一键回滚、高效分配权限等功能。

硬之城所有的目的是为了更专注于业务,给业务带来显著的变化。比如说在使用 SAE 后,在开发效率方面,我们提升了 50%。在运维的效率上面,提升了 70%。在整个技术新应用成本上面,降低了 40%,在整个问题排查方面,效率提高了 100%。

2022飞天技术峰会:硬之城如何基于 SAE 打造数智化电子工业互联网平台

具体来讲,作为 CEO 我的明显感受是:以前每次发版的时候,都需要规避用户的高峰期。比如说需要选择在半夜发版,并且在发版以后,会带来很多不确定的问题;现在基于云原生产品以后,用户是无感知发版,发版时间大大缩短,甚至我们可以做一些灰度的配置。

第二个是免运维。以前我们有很多系统和运维,做运维需要有 2 个人,现在我们的运维是 0.5 个人,运维效率大大提升,而且运维人员可以专注业务本身。

第三个是极致弹性。每个新的应用,比如说制造领域里面的 DFM、DMA,以及链路设计及完整 PCBA 的模拟生产,需要的计算能力和数据能力是非常强的,资源的需求度是不一样的,比如说高峰期是低峰谷的 10 倍甚至 50 倍,如何高效得去分配资源,让系统变得更加弹性?使用 SAE 后,现在不需要人工干预,而是可以全自动化实现。

在监控这方面更加便捷,使问题的排查更加可视化。云原生让整个运维、资源的调配,以及管理变得一键式、傻瓜式,让硬之城的成本大幅度降低。未来,期待与阿里云携手,助力更多企业数字化创新升级。

相关文章

暂无评论

暂无评论...