您的位置:首页 > 品牌资讯 >

科技推荐:Kafka将为信息系统提供LinkedIn为商务人士所做的事情

时间:2021-06-04 07:00:27 来源:互联网

科技改变生活,也在一定的程度上科改善生活!那么现如今生活条件越来越好以后大家更多的关注点都不同,但是近来有很大一部分了却同时关注到了Kafka将为信息系统提供LinkedIn为商务人士所做的事情的消息!

必要性仍然是发明之母。正如一位精明的顾问曾经告诉我的那样,“如果某个组织需要发生某些事情,它就会发生。” 他的观点有两方面:1)有些人总能找到办法完成任务; 而且,2)高级治理层,甚至是中层治理人员,很可能不知道在他们自己的机构内如何完成工作。

如果我们将这个比喻扩展到整个数据治理领域,我们可以看到现在正在发生转变。大数据的原始压力与流数据轴相结合,造成了如此大的压力,以至于传统系统在边缘处磨损,如果不是完全崩溃的话。尽管如此,目前还有无数专业人士正在开展工作,他们基本上没故意识到这一现实。

数据传播的数据驱动型企业拥有前排座位,并在很多方面推动了这一变化。想想像Yahoo!,Facebook和LinkedIn这样的强国如何通过他们对开源的巨大捐款将企业软件产业转向一边:Hadoop,Cassandra和现在的Kafka,所有这些都是由Apache基金会领导的,它本身就是一个核心参与者。 metamorhphosis。

所有这些变化的结果是什么?我们今天目睹的是数据治理本身的分类重新分类和重组。这并不是说遗留系统现在将被删除和替换。任何行业资深人士都会告诉你,遗产系统的大规模解散发生的频率与芝加哥小熊队赢得世界大赛一样频繁。至少可以说,这是一个罕见的事件。

真正发生的事情是,在旧世界系统周围建筑了一个超级结构。考虑州际高速公路的类比,它通常高于他们所服务的城市和城镇,旨在将人员和货物运送到这些人口中心,并为其中的任何人和任何事物提供出口。它们不会取代现有的道路,而是用高速替代品来增加它们。

这正是Apache Kafka所做的:它为信息系统之间和之间的数据移动提供了高速路径。按照高速公路类比,仍有许多公司使用线性消息队列,或旧标准的ETL(extract-transform-load); 但是这些路径的速度限制很慢,而且有许多坑洼; 此外,维护成本往往过高; 标牌很差。

Kafka提供了一种交付数据的替代方法,一种绝对实时,可扩展且经久耐用的方法。这意味着Kafka不仅是数据移动工具,也是数据复制者; 并且在一定程度上是分布式数据库技术。我们应该慎重对待类比太多,因为Kafka还没有运动的ACID兼容数据库的特征。不过,这种变化是真实的。

这对于信息领域来说是个好消息,因为数据现在可以自由地在国家和世界各地移动。曾经是一个痛苦的约束,即打击ETL过程的批处理窗口,现在消散很多,因为雾让位于炎热太阳的强光下清除天空。当将数据从一个系统移动到另一个系统变得边缘无缝时,一个新的机会时代就会到来。

人类可能是数据新未来之路上最大的摩擦。旧习难改。Nary一位CIO对于对企业系统进行批量更改感到非常兴奋。一位精明的高级治理人员表示:“准备好寂寞。” 在评论的一年内,他是一名顾问。这不是一条容易的道路,试图治理非常笨拙的企业数据世界。

好消息是卡夫卡提供了未来的入口。因为它是一个高性能,多方面的消息总线,它在遗留系统和前瞻性系统之间架起了桥梁。因此,以开放的思想和充足的预算接受这个新机会的组织将能够进入新的世界,而不会抛弃旧的世界。这是一个非常重要的事情。

下到商业

虽然Apache Kafka是一种开源技术,任何人都可以免费下载和使用,但为LinkedIn创建此软件的人们已经分拆了一个名为Confluent的独立实体,该实体专注于加强企业使用的产品。就像Cloudera,Hortonworks和MapR环绕Apache Hadoop的开源项目建立他们的业务一样,因此Confluent寻求通过Kafka获利。

在最近的InsideAnalysis采访中,Confluent首席执行官兼联合创始人Jay Kreps解释了其在LinkedIn的起源:

“我们试图在那里解决几个不同的问题。一个是,我们拥有所有这些不同数据系统和不同类型的数据。我们有数据库,我们有日志文件,我们有关于服务器的指标,我们实用户点击的东西。猎取所有数据 - 因为它变得很大 - 真的很难。数据的强大功能惟独在你可以将它应用到应用程序,处理或需要它的系统时才会浮现。这是一个大问题。

“我们遇到的另一个问题是我们采纳了Hadoop,这是我参与的事情。我们有这个奇异的离线处理平台,我们可以扩展,我们可以将所有数据放入。对于LinkedIn,我们所有的数据都是真实的时间。持续生成数据。总是存在这种不匹配,因为我们试图从我们的数据中实际构建业务的关键部分;在每天运行一次,可能在晚上运行并在第二天生成结果之间,这种延续的数据 - 短暂的交互时间 - 你必须要赶上。我们希翼能够在学术界做一段时间的事情,但实际上并不是一个主流的东西,它应该是能够在生成数据时利用和处理数据流,而不是他们坐下来。“

好。这正是Confluent现在寻求的各种形状和大小的企业数据。在比赛中的机会?格林菲尔德。坦率地说,在企业软件的整个历史中,人们可以争辩说,这种技术的可寻址市场绝对占上风。没有一个大型组织,甚至是数据量很大的小型企业,都无法从这项技术中获益匪浅。

由于该技术的神经学方面,尤其如此; 不仅仅是涉及的思想,而是卡夫卡为信息系统所做的事情的本质。因为Kafka可以用来治理整个组织的数据移动,所以它可以被视为不仅仅是交通警察,而是操作本身的大脑。我们处于该愿景的早期阶段,但请放心,这是真的。

Kafka如何改变数据治理

要了解Kafka如何改变数据治理的本质,只需考虑LinkedIn改变网络的方式。找到同事变得如此容易; 与人保持联系现在很容易。Kafka将为LinkedIn为商务人士所做的事情提供信息系统:让他们在这个地球的最广泛范围内保持联系。

Confluent的衍生产品象征着我们可能称之为“新创新”的事物,这是一种由软件开辟和封闭源性思维脱钩驱动的运动,由开源技术的制造者引导,由大量风险资本推动,货币化寻求改变组织和人员如何创建,收集,分析和利用数据的营利性公司。

引用Franz Kafka的话说,“从某一点开始,不再有任何回头。这是必须达到的点。”

免责声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,并不代表本站赞同其观点和对其真实性负责。如有侵权行为,请第一时间联系我们修改或删除,多谢。
精选展示

Copyright © 2021 山西商业网 All Rights Reserved