数据“入湖”,让资源变资产

数据“入湖”,让资源变资产

说到流量单位,相信大家对于MB、GB甚至TB都不陌生,那么更高一级的PB是个什么概念呢?以电影存储为例,如果一部电影大小为1GB,那么1PB相当于104,8576部电影,按照一天看一部来计算,1PB存储的电影量大概够一个人看2873年。


实际上,联想部署全球的大数据平台LeapHD仅日分析数据就超过3PB,相当于约315万部电影的数据量。


作为当今全球最大的计算机高科技制造企业,联想在全球拥有超过10个数据中心、3000多台服务器,每天仅新增数据量就高达30TB。借助部署在全球的数据中心,联想大数据平台LeapHD将联想全球的研发、生产、供应链、销售和服务业务数据进行统一存储和管理,对全价值链进行数据整合和业务综合分析,实现了对全球化管理、生产与运营体系的全方位立体支撑。


目前平台上已经建立起超过 500 个专业分析场景,联想从事数据分析和数据开发人员超过 4000 人,形成了自上而下的整体企业数据文化。


随着工业4.0时代的来临,数据已经成为继土地、劳动力、资本、技术之外的第五大生产要素。如何做好数据整合、数据治理,发挥数据价值,成为很多企业数字化转型过程中的挑战。


而联想基于自身数字化转型的实践成果,或许能很大程度上给更多企业带来启发。



01

打造大数据平台LeapHD

让数据资源变数据资产


站在科技制造业的前列,联想拥有超长制造线,是国内最大的制造企业数据集群。早在2011年,联想就开始建立起自己的大数据团队,通过大数据分析,支持软硬件产品的生产和运营。并凭借长期扎根制造业的实践经验以及对数字IT技术变革的敏锐嗅觉,推出了针对工业大数据的大数据平台——LeapHD,释放自身数据红利的同时,也为赋能更多企业的数字化转型做好了技术积淀。



大多数企业面临的数据问题雷同,数据散落各信息系统,形成信息孤岛,很难发挥数据价值,真正赋能企业运营。而LeapHD平台,可以帮助企业快速建立统一数据湖或数据中台,支持企业内外部数据的融合、海量数据的集中存储、大规模计算的并行处理、计算资源的统一管理以及数据的分析挖掘。让数据推动业务发展,真正实现数据资源向数据“资产”的转变,帮助企业抓住数据红利带来的发展机遇。


☉1 让数据全量入湖,把数据“存好”


让数据资源真正变成数据资产的第一步,是将散落在各信息系统中的数据采集并存储起来。


联想大数据平台LeapHD通过数据传输工具,把不同渠道、不同格式的内外部数据进行快速汇聚,对企业设备数据、业务数据、工厂数据、前端销售数据、供应商数据以及一些第三方的数据进行实时批量采集。并通过大数据分布式存储技术,将这些多元异构数据进行全量入湖。基于Hadoop开源生态系统,LeapHD引入了多种核心功能和组件,对复杂开源技术进行高度集成和性能优化。在分布式存储系统的基础上, 建立了统一资源调度管理系统,高效地支持大规模批量处理、交互式查询计算、流式计算等多种计算引擎。



LeapHD通过数据湖改变了原有数据库、数据仓库相对单一的存储模式,实现了结构化和非结构化数据的统一处理,打通信息系统壁垒,为数据与数据之间实现有效“互动”奠定基础。


⊙2 LeapHD维护数据质量与秩序,把数据“管好”


数据采集存储完毕之后,如何“管好”这些数据,将是保证数据质量。


LeapHD可帮助企业自动形成数据资产地图,层层下钻查看企业全局数据资产在各个业务域分布情况。并通过有效的数据治理,帮助企业实现数据资产的可信、安全和有序使用,提升数据质量。同时基于多元异构数据,平台可形成各类分析模型,并通过BI工具、可视化代码形成面向业务的数据可视化应用,为数据分析打好基础。基于安全接口,这些数据可实现与外部数据系统的数据交换和共享,提升数据的利用效率。


⊙3 提供高效分析,把数据“用好”


存储好的数据得到妥善管理后,如何被“用好”,真正发挥出数据的价值,是实现数据“变现”的关键一步。在这方面,LeapHD将通过高效的数据分析,真正做到为企业提供决策依据,赋能业务发展。


LeapHD在基础大数据计算技术的基础,通过数据建模、数据计算、数据分析形成知识积累,为企业提供包括舆情分析、装置优化、设备故障预测、用户画像、销量预测、能耗管理等分析服务,从而为企业决策赋能,助力企业实现智能化的研发、生产、运维、服务,帮助企业打造智慧供应链和数字化营销体系,真正实现数字化转型。


⊙4 降低运维门槛,让企业“玩转”数据平台


如何降低运维门槛,将数据能力开放给更多企业,是联想大数据平台LeapHD的一个重要考量,而它所具备的以下特点将助力企业快速上手,平稳运维,“玩转”数据平台。


运行高效。LeapHD可实现从GB级到PB级数据量的复杂查询和分析。通过对Spark进行深入优化,大幅提升了平台的计算性能,达到开源Spark计算能力的10倍。


安全可靠。LeapHD通过联想自身大规模、全球化、复杂环境部署和验证,构建了跨10大数据中心、2000多节点的大规模集群,平台稳定性达到99.98%。


简单易用。与传统数仓技术高度兼容,LeapHD兼容99%的SQL语法,98%的SQL Server存储和80%的oracle存储过程。仅需少量的开发工作,就可以将传统数据仓库顺畅迁移到数据中台。


易于扩展。LeapHD产品提供6类图形化大数据开发工具集,大幅度降低了大数据开发的技术门槛。



目前,联想大数据平台LeapHD已获得包括数据服务、数据开发、数据分析、流计算、数据集成、数据目录、运维管理、数据质量等在内的9项软著证明,实现全部自主可控。




02

发挥数据价值

让更多企业享受“数据红利”


基于大数据平台LeapHD,联想已经赋能包括高校、汽车、医疗、制造在内的众多企业,通过大数据技术助力众多企业提升业务运营水平,实现了以数据支撑业务新发展的战略规划。



在内蒙古农业大学,LeapHD帮助学校搭建的畜牧大数据共享分析平台,提供大数据采集、处理、开发、管理于一体的技术支持,通过多维数据融合,实现对牲畜养殖数据的综合分析,将养殖经验数字化沉淀,助力用户实现精细化养殖。同时通过安全的服务接口为平台用户提供知识共享服务,指导畜牧养殖,推动农业信息化。


在汽车领域,LeapHD已经为国内近20家大型的汽车制造企业构建了企业统一的数据服务。以广东某大型汽车制造商的项目为例,联想通过数据湖和相关数据应用的开发和运用,帮助该企业实现客户到店转化率提升10%,客户满意度提升8%,降低相关部门的工作量70%的效果。


在医疗领域,LeapHD帮助某医院对医院数据碎片进行统一纳管,实现各专业科室数据的快速共享,提升医疗效率;通过数据分析,探索疾病关联,了解引发某疾病的病因及发病路径, 并深入分析诱发因子影响力,为医疗诊断提供数据依据;通过构建多维度的分析模型,为临床决策和精准医疗提供技术支撑。


在制造领域,LeapHD通过大数据分析,为某钢铁制造企业,根据人群特性描绘用户画像。根据客户订购信息计算客户忠诚度,结合满意度调查表把客户聚成四类,完成每类用户的标签画像,从而达到精准营销的目的。


《“十四五”大数据产业发展规划》指出,大数据发展要坚持产业链各环节齐头并进、统筹发展,围绕数字产业化和产业数字化,系统布局,生态培育,加强技术、产品和服务协同,推动产业链现代化。


通过联想自身以及赋能行业数字化转型的实践不难发现,大数据正在各行各业提供全方位的服务,从设计制造到生产经营,再到社会服务,所产生的一系列数据,都可以转化为数据资产,发挥出超出想象的价值,从而助力更多行业和社会的快速发展。在助力行业数字化转型方面,联想始终在路上。



#联想##联想服务#