
如果你只有几分钟的闲置时间,那么以下是投资者、经营者和创始人应该了解的关于人工智能初创公司的信息。
预测未来。 我们都喜欢偶尔扮演诺查丹玛斯(拉丁语名 Nostradamus,法国籍犹太裔预言家)。 但是,如果你预测的未来很有可能是正确的呢? 一位撰稿人认为,由于有 Kumo 这样的公司,人工智能正在使这一切变得越来越可能。 预测智能平台允许用户查询未来,预测客户对新产品或业务变化的反应。
增强版专家。 营销人员已经利用大型语言模型来创建文案、博客文章等了。 但我们如何才能确保人工智能的力量触及法律和医学领域呢? 有两份数据强调了企业正在取得进展,让 AI 帮助医生和律师更高效地工作。
「云端」工作室。 以往,如果你想捕捉 3D 画面,就需要定制昂贵硬件。 最近的创新意味着这种情况不再需要了。 用户现在只需要一部智能手机,就可以捕捉逼真的3D图像,可用于游戏制作、电子商务产品拍摄或创意项目。 越来越多的人可以从任何地方获得大型工作室的力量。
引人注目的产品。 仅仅利用人工智能是不够的,你还必须将该技术包装成一个引人注目的产品。 有一家公司因为这种能力而被关注,它就是企业知识管理平台 Sana。 据一位撰稿人说,Sana 巧妙而有效地利用了人工智能,展示了如何将其组织成一个有凝聚力的产品。
让科学说话。 世界上到处都是人类无法破译的语言,这包括生命科学的语言,如生物学和化学。 像Enveda这样的公司能翻译科学领域的词汇、语法和语义,并允许人类通过开发新的化学物质来做出回应。
人工智能的复兴已经正式进入曲速阶段。 不到5个月,这一领域就已经发生了根本性的变化。 庄年 11 月中旬的时候,当时 ChatGPT 还没有推出,更不用说 GPT-4 了。 Bing仍然是一个无脑的搜寻领域落后者,对大谷歌公司的所有人来说,「Bard」(吟游诗人)这个词还并没有引发狂热。
越来越多的时候,我们的世界似乎就是这样运作的:一波三折,在令人心动的加速和华丽的装置中喷薄而出,然后在漫长的休息时间里归于平静。
我们的 What to Watch 系列试图保持在科技的最前缘。 虽然没人能指望知道人工智能领域的每一项创新(这是一个充满活力的有机体,同时向100个方向在发展),但我们希望,在广泛地被市场注意到之前,我们可以将一些出类拔萃的公司和引人注目的趋势呈现给大家。 为此,我们邀请了一些最厉害的 AI 投资者和创始人,讲述他们密切关注的公司和趋势。 (巧的是,这里的一位投资者投资了其中一位创始人的公司。 )
Harvey:法律助理
目录
人工智能堆叠在多个层面上都有巨大的创新。 例如,许多人正在为编码(Magic)、图像生成和核心多模态语言(OpenAI、Anthropic、谷歌等)构建有趣的新定制模型。 同样,从 Langchain到 Llama-index 再到 Chroma,工具公司也出现了爆炸式增长。 一些公司是跨界的混合型公司(比如 OpenAI 的 ChatGPT),而另一些公司则在构建独立的应用程序。
正在快速采用的应用程序的共同特征包括:
- 利用大型语言模型或其他模型的独特优势的应用程序通常会有很强的吸引力。 建设者在问自己:这项技术有什么独特之处,是以前的技术所不能做到的?
- 用轻巧的机器智能取代重复性的人力劳动或核心工作流程的应用,相当引人注目。 减少或消除痛苦的体力劳动具有明显的吸引力。
- 在许多情况下,完全自动化也许是不可能的。 因此,一些应用程序采取了人和机器相结合的方法,专注于增强用户能力,而不是完全替代人工。 人类需要纠正机器的错误,提供准确的信息。
像 GitHub 的 Copilot 一样,Harvey 也拥有这三个特点。 但 Harvey 不是协助代码生成,而是专注于法律领域。 Harvey 可以帮助律师完成尽职调查、诉讼、研究和法令遵循方面的任务。 该公司已经与普华永道(PwC)和安理国际(Allen & Overy)这样的巨头达成了交易,这是一个良好的开端。
在众多人工智能初创公司中,Harvey 脱颖而出有以下几个关键原因:
- 正确的团队。 Harvey 的创始人从用例和技术的角度来理解 AI 问题。 该公司联合创始人温斯顿·温伯格(Winston Weinberg)曾在 O’melveny 从事反垄断诉讼业务,而首席执行长加加百列·佩雷拉(Gabriel Pereyra)曾在 Deepmind 担任研究科学家。
- 深思熟虑的方法。 Harvey 采取了差异化的方法来评估法律团队的需求。 温伯格和佩雷拉在尽职调查中关注了几个关键的早期问题,获得了强烈的客户反馈。 透过迭代运算,他们实现了深度用户黏着度。
- 快速和专注。 在选择了问题集之后,Harvey 的创始人迅速构建了一个服务于特定客户需求和用例的系统。 Harvey 与安理国际律师事务所等特定客户密切合作,以确保公司能够应对真正的客户痛点。
法律和法令遵循领域是一个很好的用例,从诉讼到起草保险索赔,再到代表人类客户向法院提交文件,这些都将被人工智能重塑。 而且它不会止步于此,专门的人工智能助手,以及可以综合数据并提供答案的应用程序,在医学、金融、营销、销售、会计等领域具有相当大的潜力。
——艾拉德·吉尔(Elad Gil)和文斯·汉克斯(Thrive Capital),Thrive Capital 的合伙人
Kumo:了解未来
我是在斯坦福大学的Nvidia礼堂见到尤里·莱斯科维奇(Jure Leskovec)的。 作为「大规模挖掘数据集」课程的一部分,这位计算机科学教授为地球上一些最聪明的年轻工程师做了一场讲座。 研究生们牢牢记住了他的每一句话,我也是如此。 尤里在技术上很出色,又能准确表达,是一个罕见的综合性人才。 尤里的演讲如此引人注目的部分原因是他的挑衅性言论:在未来几年里,人工智能驱动的系统将能够预测未来。
如今,尤里提出的人工智能革命正在成为现实。 现代企业从大数据中提取强大的洞察力,从客户交易(销售资料和支持票据)到内部运营(财务数据和管理资料)再到外部信号(网络流量和社交媒体),一切都可以转化为有用的知识。
尤里、瓦尼亚·约西福夫斯基(Vanja Josifovski,Pinterest 和 Airbnb 的前 CTO)和荷马·拉加万(Hema Raghavan,LinkedIn 的前增长 AI 负责人)一起创建了 Kumo。
使用 Kumo,公司可以看到自己的未来,就像他们可以用数据库来查询过去的资料一样。 Kumo 不是分析去年发生了什么,而是让客户看到明年可能会发生什么。 这种产品的影响可能是深远的:企业不再局限于分析过去的事件,而是能够更好地预测新的机会。 用户仍然希望跟踪数据,以显示哪里出了问题,但他们将使用 Kumo 来查看如何才能做对决策。
例如,传统的客户关系管理数据库只包含客户名称、账号和交易历史等信息。 相比之下,Kumo 会提供对数据库的造访,该数据库可以预测一个给定的客户在未来一年会花多少钱,哪些新产品最有可能帮助他们,以及可能导致客户离开去找竞争对手的关键因素是什么。
Kumo 使用图形神经网络(谷达鸭s)来识别公司数据中的模式和关系。 谷达鸭s 具有强大的预测能力,非常适合分析传统统计或机器学习(ML)技术无法轻松分析的复杂的、相互关联的数据。
谷达鸭s 的应用将在未来十年推动大规模的变革。 公司将彻底调整他们的运营方式,以适应未来的客户行为。 准确地预测这种行为可以让公司提供定制的产品推荐、量身定制的促销活动和有针对性的沟通策略。 预测分析还将应用于更广泛的用例,比如欺诈检测、产品设计、规划和预测等各个方面。
自从与 Kumo 合作以来,我亲眼目睹了在人工智能尖端,一个雄心勃勃、才华横溢、意志坚定的团队能够带来什么。
——康斯坦丁·布勒(Konstantine Buhler),红杉资本合伙人
ReflexAI:培训支持
许多创始人在大型语言模型上构建应用程序,只是因为这些模型在过去一年中已经变得非常强大了。 但我对那些为了创业而创业,或者因为发现了一个令人兴奋的趋势而创业的人从来都不感兴趣。 我喜欢那些已经建设了一段时间的建设者,他们发现了一个独特的创业机会,并意识到自己需要创办一个特定的公司来实现这一机会。
这就是 ReflexAI 的联合创始人山姆·迪瑞森(Sam Dorison)和约翰·凯勒瑞(John Callery)所做的。 作为特雷佛项目(The Trevor Project,一个在性少数青年中预防自杀的关键组织)的领导者,他们在 2019 年开始修补例如 GPT-2 这样的 OpenAI 早期模型。 他们意识到了利用这些模型来帮助培训全职辅导员和兼职义工进行危机对话的潜力,并花了几年时间构建软件来实现这一目标。 他们的危机接触模拟器被《时代周刊》评为2021年最佳发明之一,培训了数千名辅导员,以更好地支持孩子们的心理健康,特别是在需要的时候,用以拯救生命。 然后,在 2022 年,当整个世界都意识到 GPT-3 的力量时,山姆和约翰意识到了一个更大的机会:把他们从特雷佛项目中学到的东西,应用于构建人工智能驱动的支持工具,以培训、开发和增强跨组织和公司的一线团队。
ReflexAI进展迅速,早期的合作伙伴包括 谷歌.org 和退伍军人事务部(Department of Veterans Affairs)。 透过模拟,他们的软件可以帮助培训代理人进行具有挑战性的对话,并提供可操作的回馈,以帮助他们随着时间的推移改善互动方式。 ReflexAI 是由一个使命驱动的团队构建的,该团队拥有多年使用这些模型的跟踪记录(包括 GPT-4,他们从 OpenAI 获得了早期访问权限)。 ReflexAI在解决棘手问题上处于得天独厚的地位。 我迫不及待地想看到它对高风险呼叫中心营运和其他领域的影响。
——尼科尔·巴素·彻温蒂(Nikhil Basu Trivedi), Footwork 的联合创始人和普通合伙人
Together:一个去中心化的人工智能「云」
可以说,人工智能正在经历其Linux时刻。 如今,关于「将在市场中占据主导地位的是开放的还是封闭的 AI 模型」的争论尚未平息,这与上世纪 90 年代末开始的微软 Windows 与 Linux 的争论类似。 答案最终变成了「两者都有」,但是 Linux 的开放模式主导了高阶运算。 这与移动操作系统竞争的结果不同,在移动操作系统中,苹果 iOS 领先于 谷歌 更具扩充性的 Android。
在过去的几年里,许多组织专注于发展人工智能的开放模型和数据生态系统,包括 Hugging Face、Meta、Runway 和 Stability,以及 EleutherAI、CarperAI、LAION 等研究组织和许多学术机构。 他们得到了同时投资于开放和封闭人工智能生态系统的公司的帮助。 谷歌、微软、Nvidia和其他公司通过TensorFlow、Jax、DeepSpeed、Megatron等模型和框架,对开源生态系统做出了重大贡献。
随着人工智能领域的模型和数据的开放,该领域的大规模运算仍然只依赖于少数大型云供应商。 运算必须是专有的吗? 比特币、以太坊和其他加密货币网络证明,去中心化的大型共享运算资源池是可能的。 如果我们可以重新创建这些规模化的网络,但将其用于更高价值的工作负载,如大型语言模型训练和推理,会怎样?
Together 正试图做到这一点。 这家初创公司正在构建一个结合数据、模型和计算的去中心化云,使研究人员、开发人员和公司能够利用人工智能的最新进展。
开放运算的一个挑战是培训基础模型的成本不断上升。 如果传言属实,那么我们可以看到这一数字从数千万美元上升到了数亿美元。 成本可能很快就会突破10亿美元。 至关重要的是,这些成本可能成为进入的壁垒,使行业向集中化倾斜,因为只有少数大型模型和计算机供应商能够负担得起运营费用。 这也反映了高端半导体市场的演变过程。
通过减少准入和成本壁垒,使更多的公司、研究机构和个人能够做出贡献,Together可以确保构建一个充满活力的开源生态系统。 从GPT-JT和OpenChatKit(一个开源的ChatGPT)开始,Together Cloud已经证明,用户可以在网络带宽比传统数据中心慢100倍的商用异构硬件上训练基础模型。 过去十年的技术依赖于云服务,人工智能革命可能会建立在 Together 这样的供应商之上。
以下是 Import AI 的节选,其中将 Together 的重要性与开源生态系统进行了模拟:
Together、LAION、Eleuther 都代表了一个大趋势,即对去中心化人工智能生态系统的渴望,在这个生态系统中,开源模型由不同的团队在日益区中心化的运算上进行训练。 这里有「大教堂与市集」(The Cathedral and the Bazaar,是艾瑞克·史蒂芬·雷蒙所撰写的一部软件工程方法论)的影子,大教堂的建造者(DeepMind, OpenAI 等)可以造访大量的运算和集中化团队,而市集的人们(Eleuther, LAION 等)可以存取更少的资源,但通过自下而上的实验能实现更大的集体智慧。 其中一种方法将首先建立我们称之为超级智慧的东西,而无论哪种方法更成功,其政治影响都将是巨大的。
——布兰登-李维(Brandon Reeves), Lux Capital 的普通合伙人
PostEra:快速「药物发现」
人工智能正在药物研发领域飞速发展。 各公司都在竞相生产专为特定目的设计的人工智能药物。 这些组织依赖于模型来搜寻可能的分子结构空间。 这一过程提供了令人兴奋的可能性,也提出了新的挑战。 例如,随着人工智能在预测具有理想药物特性的结构方面变得越来越好,问题将变成:我们如何制造它们?
在将一种小分子药物推向临床试验的过程中,大量的时间、精力和金钱并没有花在发现药物上。 相反,这些资源被花在了线索优化上,在这个过程中,药物化学家采用最初的结构,反复设计、合成和测试变体。 化学家们这样做是为了找到具有更高效力和特异性、毒性更小的版本。 这种的优化周期可能需要数年时间,每个药物项目需要花费数百万美元。
大部分时间和金钱都花在了「设计-制造-测试」循环中的「制作」阶段。 数以百计的分子变体必须由训练有素的合成化学家单独合成,每个变体都需要一周或更长时间。 这阻碍了药物的快速迭代,并以成为一个全球性的瓶颈问题。
PostEra是一家应对这一领域挑战的公司。 PostEra 由亚伦·莫里斯(Aaron Morris)和剑桥大学教授阿尔法·李(Alpha Lee)共同创立,于 2020 年早期崭露头角。 这要归功于他们的项目COVID Moonshot计划,该计划使用了PostEra的ML平台,对全球400多位科学家的抗病毒想法进行优先排序。 这是人工智能和众包合作的一个强有力的例子,它成功地发现了有前途的候选药物,以便进一步开发。
PostEra 的药物发现平台被称为「Proton」,它利用生成式人工智能来消除设计周期中的化学合成瓶颈,以实现更快的迭代和测试更多的分子。 Proton 利用该公司的「Manifold」软件系统,为任意化学结构提供实用的合成路线。 Manifold 基于他们团队的早期工作,使用语言模型来预测化学反应的结果。 PostEra 将其平台用于其内部研发系统和与辉瑞公司的战略合作。
随着人工智能在「药物发现」中变得越来越重要,像 PostEra 这样的公司可能会在「帮助药物进入市场」方面发挥重要作用。
——维斯瓦·科尔如(Viswa Colluru),Enveda Biosciences 首席执行长; 以及大卫·希利(David Healey),Enveda Biosciences 资料科学副总裁
Pathway Medical:加强版医生
随着GPT-4的火热发表,2023年有望成为应用人工智能激动人心的一年,许多企业家都在竞相打造下一个「LLM for’X’」。 但是,尽管快速行动,打破陈规在某些行业可能管用,但在医疗行业却行不通。
医疗保健行业是接受新技术最慢的行业之一,这可能也是合理的。 一个预测电子邮件文本准确率高达70%的人工智能模型,也许只是不尽如人意,但如果这个人工智能模型是被用来做出影响病人结果的决定的,那则是不可接受的。
如果我们想更快地实现现代人工智能技术在医疗保健领域的全面影响,那么我们需要解决人工智能模型的基础:数据。 不幸的是,在许多医疗保健应用程序中,造访高质量的结构化数据仍然具有挑战性。 这不再仅仅是关于大数据(即数据越多越好),而是关于智能数据,以及以与特定行业用例相关的格式造访高质量的信息。
这就是像 Pathway Medical 这样的公司比新来者有优势的地方。 它已经聚集并建立了大量的智能数据池,用于推动医疗保健领域特定的大型语言模型。
Pathway 是一个以人工智能为先的临床决策支持工具,它花了数年时间建立了一个庞大的、结构化的医学知识图谱,并由专家审查以确保可靠性。 透过利用先进的语言模型和这些一流的数据,Pathway 旨在产生可靠的输出,没有自己捏造出来的东西,而是以良好的参考和验证的信息为基础。
Pathway 就像是医生的智能助手。 透过使用 Pathway,医疗专业人员可以无缝地阅读相关医疗指南,接收针对患者的建议,并探索差异化的诊断。 Pathway 称自己是医生的「即时第二意见」。
随着像 Pathway 这样公司的发展,我们希望看到人工智能在医疗保健领域的巨大潜力得以实现,改变临床医生获取关键信息和与之互动的方式。 这应该有助于简化教育和决策过程,最终改善患者的情况,并提高护理标准。
——瑟伦斯·波伊斯(Therence Bois),Valence Discovery 联合创始人兼首席营运长
Luma:属于每个人的 3D
当我开始写这篇文章时,Luma还是一家小型创业公司,在 2021 年筹集了一笔规模不大的种子轮融资。 此后,我不得不持续修正这些记录。 3月20日,Luma宣布获得由 Amplify Partners 领投的 A 轮融资。 这一点也不令我惊讶。
神经辐射场(Neural Radiance Fields),更广为人知的名字是「NeRFs」,简单来说,它是一种技术,可以让你把从任何设备拍摄的照片转换成完整的 3D 模型。 与之前的 3D 扫描技术不同,它不需要专门的硬件(如激光雷达传感器),且输出的质量比我们以前见过的任何东西都要高得多,具有更高的视觉保真度和照片真实感。 光线、阴影和反射都可以通过 NeRFs 实现。
Luma 是部署这项技术的先锋。 这家初创公司的应用程序可以让客户用智能手机捕捉逼真的3D图像,这些图像可以用作游戏资产、电子商务产品照片或艺术创作。
那为何说这很重要?
随着VR技术的出现,AR技术可能在不到十年的时间里就会出现,对逼真3D资产的需求应该会迅速增长。 此外,我们有理由认为,这些革命可能需要改进 3D 捕捉技术才能完全实现。 在过去,这个过程是困难的、昂贵的,有时甚至是不可能的。 但现在不一样了。
甚至在 VR 和 AR 起飞之前,像 Luma 这样的产品就可以解锁令人兴奋的新用例了。 Etsy 商家可以很容易地生成他们正在出售的桌子的 3D 模型。 一个独立开发者只需要一部智能手机,就可以创造出一款以逼真世界为背景的游戏。 如果你能把一个东西拍下来,它就能变成 3D。 Luma 的宣传语说得好:「3D,是属于每个人的! (3D, finally for everyone)」
考虑一下 NeRFs 将如何与其他技术相结合,来创造未来的媒体。 在短短几年内,你可能会看到一部以 Luma 生成的 3D 模型为背景的长篇电影,演员由 Midjourney 生成,剧本由 ChatGPT 编写,并由 ElevenLabs 配音。
——艾索·康德(Eiso Kant), Athenian 创始人兼首席执行长
Coactive: 解码视觉数据
从社交媒体视频到智能手机图片,视觉内容主导着我们的日常生活,并且正在以前所未有的速度增长。 尽管视觉内容无处不在,但它是最具挑战性的信息分析形式,因为其通常是非结构化的。 对于数据驱动型组织来说,错过在视觉领域的洞察是一种损失。 这也是一个更广泛问题的一部分:根据麻省理工学院的资料,80%的企业资料是非结构化的,数据被困在音频、视频和 web 服务器日志中。
Coactive 通过机器学习为非结构化数据带来结构。 它帮助数据驱动型团队从图像和视频等视觉内容中获得见解。 Coactive 很有趣,因为企业将有大量的机会来组织和分析多媒体内容,特别是对于有大量视觉内容的行业,例如零售、社交媒体、医疗影像、游戏和自动驾驶汽车。
在技术层面,Coactive 将非结构化数据引入 SQL 世界,因此分析人员可以对其进行注释、搜索、查询和建模。 今天最流行的用例是搜索、推荐、信任和安全以及数据分析。
透过该产品,客户可以通过API或安全数据湖连接,将原始图像或视频直接上传到Coactive的平台。 然后,视觉数据被 Coactive 的平台嵌入和索引,几乎无需人工监督或标记。 接下来,通过Coactive完全托管的图像搜寻API和SQL接口,用户可以收集见解并运行查询和搜寻。 Coactive 精心开发了其 UI/UX,使大众和数据科学家都能轻松利用它并从中获得价值。
例如,一个时尚品牌可以上传大量的视觉图像和视频,并在几秒钟内就可以定义概念和类别,而无需几天。 这使得品牌能够更好地了解客户如何与他们的产品进行近乎实时的互动。
几年来,我们一直在跟踪机器学习基础设施的突破和商业智能的发展。 考虑到这些趋势,企业不仅会产生大量的视觉内容,而且还需要理解这些内容。
——伊桑·库兹韦尔(Ethan Kurzweil), Bessemer Venture Partners 合伙人
Sana:帮公司获取知识
生成式人工智能的火爆是有目共睹的,推特上充斥着各种形式令人兴奋的技术展示,从文本、图像到视频等等。 大型语言模型在某些任务上的出色表现让人难以理解,而且它确实让人觉得是继手机之后的第一个令人兴奋的平台。
但在所有的兴奋中,重要的是要记住,与任何其他伟大的技术一样,人工智能只有在与现实接触时,其用户体验才会好。 现在,我们看到很多很酷的解决方案,展示了神奇的功能,如记录、总结、创意写作、图像/视频生成和编程,等等。
其中大部分可能会成为现有平台的功能(GitHub、微软、Notion 和 Intercom 已经在积极地将人工智能添加到他们的产品中),而不是成为独立的产品,因为它们无法回答这些无聊的问题:谁会每天使用它,在什么情况下使用? 人们会为此买单吗? 这是一个功能还是一个产品? 它是否站得住脚,你能否围绕它快速建立起大型业务?
我认为,许多将在未来几年获胜的公司,都是在几年前由那些意识到大型语言模型和生成式人工智能巨大潜力的创始人创办的。 他们在构建平台(而不仅仅是工具)方面领先一步,并通过与现实世界的互动磨练了自己的产品意识和客户直觉。
让我感到兴奋的一家公司是 Sana,这是一家面向企业的人工智能学习平台。 该产品既是一个传统的学习管理系统(你可以创建课程和运行实时会话),也是一个知识管理平台(你可以创建一个「公司大脑」),可以通过将其整合到 谷歌 工作空间、Notion、GitHub 等平台来直接查询。
该平台非常棒,具有实时协作功能,并且在核心 SaaS 功能方面遥遥领先于市场。 你可以使用人工智能从头开始制作整个课程(文本、图像、测验),或者将人工智能作为一个助手,通过自动化信息检索和内容创建来帮助你更快地完成工作。
从长远来看,你可以想象一个生成式学习系统,它了解公司中所有事物和每个人的完整背景,可以按需培训员工,并以结构化的方式设计培训课程。 它可以监控员工的知识缺口,制作一个简短的个性化课程,并直接实时传授给每个人。 Sana 提高生产力的潜力是巨大的。
Sana 面临的挑战是发明一种可以轻松适应企业工作流程的人工智能优先产品。 人们不喜欢一下子有太多的变化。 真正的艺术在于时间的顺序:先用熟悉但比现在好 10 倍的体验吸引他们,然后慢慢但稳定地将他们引向比现在好 100 倍的全新解决方案。
学习与发展(L&D)传统上是风投们忽视的一个类别,它是一个低预算的成本中心,很少是C级的话题。 我们还没有看到一家超过100亿美元的公司将自己定义为L&D平台。
但我认为,有一个明显的长期趋势可能会改变这种情况:学习不再仅仅与法令遵循和人力资源有关,它同时也是为了确保销售人员是产品专家,开发人员能够快速上手,并且每个人都能理解公司的战略。
知识管理、生产力和 L&D 之间的界限越来越模糊,这为我们提供了更多的机会。 世界发展得越快,企业就越有必要提高员工的技能,并以 推特 传播信息的速度传播内部信息。
到目前为止,从 Sana 的执行和吸引力来看,他们不仅有机会建立一个伟大的公司,而且有机会将整个 L&D 类别演变成与今天完全不同的东西。
——维克多·瑞帕百里(Victor Riparbelli), Synthesia 联合创始人兼首席执行长
Enveda:让化学「说话」
目前人工智能领域有什么值得关注的? 一切都值得关注。
我们正处在人类历史上的一个特殊时刻。 我们发明了一种「外星智能」,并在(有点惭愧地)努力应对近期的技术和风险影响。 大型语言模型不仅能理解我们熟悉的语言,还能理解人类所不能理解的语言。
如今,ChatGPT 能够用人类的语言创造出内容,而且我们没有止步于此,而是将大型语言模型指向互联网,解锁了我们集体的数字知识宝库。 但这些应用仍停留在我们人类可以做、写或说的领域。
为什么不学习一种全新的语言呢? 这些语言潜伏在我们的宇宙中,但从未被人类说过。
很多(如果不是全部的话)生命科学可以被「塑造」为具有独特的语法和字母、并最终具有语义或意义的语言。 以生物和化学为例,在语法方面,生物学使用 DNA 或氨基酸序列的 G-A-T-C 字母,而化学则依赖于数量表示,包括质谱分析法等。 在语义上,你可以指出生物学上的蛋白质结构和功能,化学上的代谢物结构和链式反应。 简而言之,每一种生命科学都有自己独特的语言。 我们可以把生物学和化学看作是它们各自领域的语言,我们一直被这些语言包围着。
随着大型语言模型的出现,我们现在得以理解和回应科学的语言。 我的公司Dimension领导了Enveda公司的B轮融资,这家公司正在该领域深耕。 它教授电脑化学,也就是化学语言。 结合下一代质谱技术(化学空间的句法表示)和大型语言模型,Enveda可以从一般难以辨认的句法发展到定义明确的语法,最后发展到化学结构和性质的语义。
为什么这很重要?
- 我们突然可以读懂数十亿年进化中产生的功能乐高积木碎片。 (地球上自然产生的化学物质是什么? 为什么生物过程在强烈的选择压力下进化到产生这些成分,而不是其他成分? )
- 我们可以通过分析细胞内的代谢物(即 DNA、RNA 和蛋白质的组成部分)来更好地了解人类疾病。
- 我们可以用这种新的工具(语言),来设计新的化学物质,以此作为治疗人类疾病的手段。
——萨瓦因·达尔(Zavain Dar), Dimension Capital 创始人兼管理合伙人
