【转】美国大数据创业公司

abloz 2015-06-07
2015-06-07

下面是美国coursera公司工程师董飞在知乎的总结。

美国大数据创业公司篇

董飞 ·

这里面创业公司太多了,包含提供商务数据分析,可视化报表,大数据平台,数据存储,挖掘应用等,我就简单说一些我感兴趣的,它们大多在硅谷,其他的可以参考。更新是到2015年6月2日,88家。

Palantir__:融资:9.5亿美元。150亿美金估值,已经是超级独角兽单独列出来。Peter Thiel创办大数据公司。数据集成、 信息管理和定量的分析。连接到商业、 专有和公共数据集,并发现趋势、 关系和异常,包括预测分析。

##############

Database

MemSQL__: 号称最快的内存数据库。

GraphSQL__:高效、大容量的图形数据库和分析平台,创始人是国人。

MongoDB__: 融资:3.11亿美元。细分行业:面向文档数据库采集。它灵活的存储方式非常受青睐。

DataStax__:融资:1.9亿美元。细分行业:基于Apache Cassandra的数据库支持平台。客户包括eBay、Adobe、Netflix等

Couchbase__: 文档型数据库,高性能,在LinkedIn运维也推荐使用

FoundationDB__: 兼容事务处理的NoSQL

RethinkDB__: open-source, scalable database that makes building realtime apps dramatically easier.

RocksDB__: FB旗下的开源数据库类似LevelDB.org__设计

Presto__:FB旗下分布式SQL查询引擎

Hadoop

Hadoop 三剑客其中 Hortonworks 已经上市

Cloudrea__:融资:10.4亿美元。细分行业:大数据分析软件、服务与培训。今年,这家大数据巨头企业即将进入中国市场。

MapR__:融资:1.74亿美元。细分行业:大数据分析软件、服务与培训。它的创始团队来自Facebook、Google和Yahoo等公司

Altiscale__: 提供的Hadoop作为一种服务(HAAS)

Qubole__:Hadoop服务提供商,一些创业公司如Pinterest也是它的客户

Splice Machine__: 基于Hadoop的实时大数据技术公司,支持SQL 事务处理,并针对OLAP 和OLAP 应用进行实时优化处理

Continuuity__: a Hadoop-based big data application hosting platform.

Platfora__: Provide a big data analytics solution that transforms raw data in Hadoop into interactive, in-memory business intelligence.

Xplenty__: Provide HaaS.

Nuevora__: Provide Big Data analytics applications.

机器学习

Everstring__:通过不断地主动挖掘和分析全网在线企业信息,结合每家企业内部的客户关系管理系统,利用机器学习自动建立量化客户模型预测谁是下一个客户。

Luminoso__:自然语言处理和机器学习技术,帮助企业分析消费者在各种通讯渠道中讨论的话题

Dato__:GraphLab提供了一个完整的平台,从别的应用程序或者服务中抓取数据,让机器学习这个模型,并将学到的知识作为基础,自动地进行准确的预测和决策制定。

Paxata__:应用机器学习技术处理大数据难题

0xdata__:H2O 的算法是面向业务流程——欺诈或趋势预测

Numenta:__developed a cohesive theory, core software technology, and numerous applications all based on principles of the neocortex

PredictionIO__:开源的机器学习服务器

Alpine Data Labs__: 大数据预测分析

Zementis__: 预测分析决策管理平台

Trifacta__:人机交互数据分析平台

Metamind__: 提供相当完美的人工智能解决方案,这种解决方案主要由“深度学习(DL)”支持

RapidMiner__:数据挖掘工具

FiscalNote__: 数据挖掘软件和人工智能手艺预测立法机构的投票成果,从而判断某些议案可否通过。

BI工具和其他

Looker__:一个基于Web的BI平台,目前已以与Amazon Redshift、 Teradata Aster、HP Vertica、Greenplum、Impala、 BigQuery以及Spark等数据源进行集成;定制和复用数据可视化体验。

Confluent:__Kafka初创公司。

Databricks__:主要开发Spark。

Elasticsearch__:分布式搜索引擎,基于Lucene开发

Tachyon Nexus:__ 主要开发Tachyon。

Snowplow Analytics__:开放代码的分析平台,特别是基于AWS的分析。

Datameer__:开源的数据处理系统,用于构建强大的超级计算机廉价服务器集群。

DataSift__:社交数据分析公司

Datadog__:数据监控

Sumo logic__:日志管理过滤

Ginger.io:__ 为研究人员、物理学家和医疗保健人员提供相应的行为分析能力

Birst__ :从事商业智能和数据分析,利用云计算来颠覆传统的IT服务模式

Interana__:自助分析数据平台

gridgain__: 基于内存的大数据实时处理系统

Lucidworks__:Solr企业版

DataTorrent__ :可以将数据处理速度从实时提高至“现在时”

WibiData__:专业大数据软件包

Dataguise__:大数据安全公司

Aerospike__:开源NoSQL数据库,支持近实时数据分析

Accumulo__:可靠的、可伸缩的、高性能的排序分布式的Key-Value 存储解决方案,基于单元访问控制以及可定制的服务器端处理

Pentaho__:以工作流为核心的、强调面向解决方案而非工具组件的BI

Metamarkets__:可视化分析,帮助在线媒体公司分析高流量的流媒体数据

Pivotal__:一个以数据为核心的企业级PaaS平台

Pachyderm__:Dockerized MapReduce

Premise__:走众包数据采集途径向金融机构提供数据

Domo__:融资:2.5亿美元。细分行业:云商务智能。它的主要服务客户是企业用户,其数据库可以帮助企业维持日常的运转。

SumAll__:social media analytics and business dashboard

Tintri__:“智能混合闪存”,混合了闪存和计算机硬盘驱动器

Datarella:__Big Data Strategy & Product Development

Snowflake__:云数据仓库

GoodData__:融资:1.01亿美元。细分行业:云商务智能。GoodData向SaaS供应商提供技术集成服务,在平台内获得分析数据。

Amplitude__:BI分析软件

Mu Sigma__: 融资:1.95亿美元。细分行业:大数据科学服务。这是一家向企业客户提供数据分析和决策支持服务的研究公司。

Mixpanel__:有web和移动分析平台,其提供的服务可以分析监测用户活动

DataHero__:打着“你的数据你做主”的口号,试图弥合大数据同普通用户之间的鸿沟,即帮你分析跟你密切相关的数据

Opera Solutions__融资:1.22亿美元。细分行业:大数据科学服务。其提供的大数据服务可以一次性采集数十亿条数据。

Guavus__ 融资:1.07亿美元。细分行业:智能解决方案平台。它的主要投资方是英特尔。

Kissmetrics__:分析服务公司

treasuredata__: 提供大数据存储,查询,分析云服务

Quantcast__: 大数据广告公司

Spagobi__: BI 开源工具

Zoomdata__: 大数据可视化展示

Birst__:商业智能和数据分析,安全性隔离性

Clearstory__:大数据分析服务商,帮助企业和客户收集、处理、分析数据

Actian__:深藏不露的数据库公司。目前其年收入大约为1.5 亿美元。对 ParAccel 的收购已经是过去5 个月中Actian 进行的第四笔收购

Eclipse BIRT__: Eclipse旗下数据可视化

Netezza Analytics__: IBM 旗下数据仓库

DataGravity__: software-based company engaged in the IT industry and is focused on providing data management services.

Zipfian Academy__:Data Science Bootcamp

Civis Analytics__:big data analytics firm that helps companies, non-profits, and campaigns leverage their data to develop smarter strategy.

Quid__: Business Analytics Software

inPowered__:discover the most engaging content written about them and turn them into native ads that are promoted across the web, mobile apps

Cask.co__:helps developers and organizations deliver Hadoop solutions more quickly and effectively with the open source

Tamr__:quickly, efficiently and cost-effectively connects and enriches all of your internal or external data sources

ScalingData__/Rocana__: building software for large scale machine data (logs, metrics, etc.) and event management, specifically in the domain.

Ayasdi__: use mathematics theory to find potential patterns in data and visualize them as geometric shapes

下面是来自Bo Yang的总结

从对美国大数据市场的调研来看,我们可以得到一些启示:

  1. 美国的数据分析市场非常大,容纳超过百家公司,这得益于美国信息化的高度发达。

  2. 虽然有很多公司,但是大家很少有重复竞争,每一家都有自己的特色,在自己的领域内发展,这也符合美国公司注重差异化相关。

  3. 传统的商务数据分析公司在维持旧有客户和平台的情况下,在积极向大数据技术扩展。

  4. 新兴的大数据技术发展非常快,但是目前还没有到成熟阶段,除了Hadoop之外,没有其他统一的技术被各家公司采用。

  5. 新的大数据技术趋势是快速响应,开始追求数据的实时处理和快速查询。

相对于美国市场,中国的大数据市场还处于非常初期的阶段,这可能跟中国的信息化程度相关。做长期展望预测,如果中国的信息化发展到美国的阶段,并且公司普遍采用基于数据的量化决策机制,将会迎来一个大数据发展的爆发式增长。

参考链接

  1. 10 Hot Big Data Startups to Watch in 2015 from A to Z__

  2. 10 Hot Hadoop Startups to Watch__

  3. 2015年值得关注的25家初创科技企业__

  4. 融资最多的大数据创业企业__

  5. 美国大数据创业公司总结__


如非注明转载, 均为原创. 本站遵循知识共享CC协议,转载请注明来源