英文原文:The 10 Coolest Big Data Startups Of 2014
近年来,很少有 IT 细分市场可以像大数据市场一样吸引企业家的关注。如今,商业和消费者正在产生 TB 乃至 PB 级数据,大量公司也加大了研发,致力于收集、存储、管理、分析数据。
以下是 2014 年大数据领域格外瞩目的十家新兴大数据创业公司
1. Aerospike
创始人和 CTO:Brian Bulkowski
包括 MongoDB、CouchBD 和 Redis 等公司都在争夺下一代数据库的市场份额。Aerospkie 创建于 2009 年,总部位于加州山景城。该公司研发了一组用于高性能应用的、实时的、闪存优化的 NoSQL 数据库。
内存数据库满足可靠事务处理的 ACID(原子性、一致性、隔离性、持久性)需求。Forensiq 是一家提供在线广告诈骗检测服务的公司,11 月 Forensiq 宣称其每个月需要用 Aerospike 提供的数据库处理 1 万亿次请求。
年初 Aerospike 获得 2000 万美金的C轮融资。11 月,Aerospike 对数据库性能进行了优化,提升了存储能力,并进行了新功能和 Hadoop 的整合。
2. Altiscale
CEO: Raymie Stata
Hadoop 在 2014 年很火,但是其大数据平台仍然十分复杂,并且很难用。这也是 Altiscale 和它的 Hadoop 服务引人注目的原因。Altiscale 的服务主要目的是解决 Hadoop 的抽象性与复杂性,为工程师搭建一个完整的 Hadoop 环境,并且对其进行维护与管理,让用户可以更专注于他们的数据与应用。当客户的需求发生变化的时,Altiscale 也会做出相应的调整与变化。他还可以将 Apache Hadoop 加上业务支持作为云服务进行交付。
Altiscale,总部位于加州 Palo Alto,成立于 2012 年。今年 10 月这家公司开始提供 Hadoop 上的 SQL 服务,这使得可以通过使用 SQL 用户接口或 API 访问 Hadoop 数据。
Altiscale 的高层包括 CEO Raymie Stata 和 CTO David Chaiken 都来自雅虎,雅虎也是 Hadoop 的发源地。这些人知道他们自己在做什么。这个月初 Altiscale 获得了 3000 万美元的二轮融资。
3. Databricks
CEO:Ion Stoica
2014 年,Apache Spark 是大数据领域最火的技术之一,它是一款可以像 Hadoop 一样提高大数据系统性能的内存数据处理引擎。这个开源软件来自加州伯克利大学的一个项目。
Databricks 提供了一个基于 Spark 的平台(该平台发布于六月),用于处理数据转换、探测、分析等大数据任务。2013 年成立的 Databricks 公司不是一家以开源技术为噱头的创业公司。DatabrickCEOIon Stoica(加州伯克利大学的计算机科学的教授)和 CTO Matei Zaharia 创建了 Spark,他们借助大数据一站式服务软件将他们的专业技术发挥的淋漓尽致。
4. DataStax
CEO:Billy Bosworth
DataStax 是下一代数据库市场的另一个引领者,该公司支持 Apache Cassandra。Apache Cassandra 是高扩展性、容错的 NoSQL 数据库,思科、eBay 和 Twitter 都在使用这种数据库。
DataStax 销售 DataStax 企业版,这是商化版本的 Cassandra,还销售支持该平台的工具和服务。这个月初,公司推出了 DSE4.6,其具备新的 Spark 流分析性能,这表明该公司开始涉足物联网。
DataStax 成立于 2010 年,总部位于加州圣克拉拉,在 9 月的E轮融资中获得惊人的 1 亿 600 万美元的融资,当下总计获得 1.9 亿美元融资。
5. DataTorrent
联合创始人兼 CEO:Phu Hoang
DataTorrent 是帮助用户即时处理、监控、分析数据的企业级实时流分析平台。该公司声称基于 Hadoop 的 DataTorrent RTS 系统每秒可以执行数亿次、甚至十亿次处理。
当今,很多行业在大数据领域面临的一大挑战是延迟——如处理类似事务的流数据。DataTorrent 的联合创始人兼 CEO Phu Hoang 曾在雅虎领导 Hadoop 的研发,也看到了类似 Data Torrent RTS 类产品的发展机会。这家在圣克拉拉的创业公司成立于 2012,在该年 6 月发布了 DataTorrent RTS,10 月发布了 RTS 2.0。
6. Qubole
联合创始人和 CEO:Ashish Thusoo
基于 Haddop 的 Qubole 数据服务是一个云平台,企业可以用该平台存储和管理大量的结构化和非结构化数据,且可执行数据分析和一些其它任务。你可能说 Qubole 很自恋:公司注重于使自己的平台尽可能随着规模及其他内置管理性能进行自管理;此外,友好的用户交互自服务和数据整合功能都不需要数据科学家或程序员。
该公司 CEO Ashish Thusoo 与印度总裁 Joydeep Sen Sarma 在 2012 年一起创立了 Qubole。先前他们共同管理 Facebook 的数据基础建设团队,负责大数据处理,之后他们共同参与了 Hadoop 的 Apache Hive 数据仓储基础建设项目。月初,这家公司在B轮融资获得 1300 万美元融资。
7. Snowflake Computing
CEO: Bob Muglia
Snowflake Computing 于 10 月悄然出现,推出了基于云的数据仓储服务,其服务定位是成为复杂、昂贵本地cangku.html" target="_blank">数据仓库系统的替代者,旨在实现灵活和易于管理等特性。Snowflake 的 Elatic 数据仓储目前还是测试版,在未来将很有可能替代亚马逊网络服务 Redshift 和 Google 的 Big Query。
CEO Bob Muglia 说:“Snowflake 的 Elastic 数据仓储服务相较于本地数据仓储可以节省 90% 的成本,而且比竞争者 AWS 和 Google 的产品更易于使用。Snowflake Computing 目前研发的数据库系统既可以处理结构化和半结构化的数据”
8. SumAll
CEO: Dane Atkinson
SumAll 认为不仅大企业需要大数据分析,中小型也需要。这家在纽约的初创公司为企业提供了一个可以收集企业电子商务、邮件市场、社交媒体、广告系统(如谷歌的 AdWords)上的数据并在一个互动可视化界面进行展示的在线分析平台。
SumAll 成立于 2011 年,侧重于产品的易用性,其产品不仅销往大企业,也销往中小型企业。该公司网站的统计数据显示,公司拥有 23.3 万的 SumAll 用户,获得 1400 万美元融资,雇员平均年龄 32.6 岁,每年消费 22 桶啤酒。
9. Tamr
联合创始人和 CEO:Andy Palmer
大数据的一个问题是数据太大了,大数据通常有很多不同的数据源,而且这些数据源一直在变换。
Tamr 公司的软件通过机器学习技术为这些数据源提供单一视角,同时为企业提供一个完整的数据资产库存并寻找分布数据集之间的联系。该公司的技术最早来自 MIT 的计算机与人工智能实验室。
2013 年,数据库专家 Michael Stonebraker、行业资深专家 Andy Palmer 和 Ihab Ilyas 共同创建了 Tamr,今年 5 月,公司正式运行。同时,这家基于剑桥和麻省的公司筹集了 1600 万美元的风险投资。
10. WibiDat
联合创始人和 CEO:Christophe Bisciglia
大家都很了解亚马逊可以为商户提供定制化的体验。位于旧金山的 WibiData 创建于 2010 年,研制了一款可提供类似服务的实时应用。
该公司的 Wibi 企业平台使用先进的分析技术给消费者提供推荐、定制化的内容和相关搜索结果。该平台基于一组开源 Apache 技术,其中包括 Hadoop、HBase 和 Cassandra,也包括用于实时收集、分析、服务数据的 Kiji 开源框架。年初该公司发布了 WibiRetail,该应用是公司为零售商提供的首个“开箱即用”的应用。