侧边栏壁纸
  • 累计撰写 84 篇文章
  • 累计创建 35 个标签
  • 累计收到 1 条评论

目 录CONTENT

MindOS:站在AGI风口,创业两年的教训与思考

天明
2023-12-18 / 0 评论 / 0 点赞 / 56 阅读 / 6038 字 / 正在检测是否收录...

MindOS:站在AGI风口,创业两年的教训与思考

  原文链接

  投资人最常问的一些问题:

AGI是什么?多久能实现?

有哪些单点问题AGI能解决得比现在的AI好?

大厂都没搞出来,凭什么你们能搞出来?

大厂搞出来了,你们凭什么能跟它们竞争?

一个做虚拟人的干嘛叫OS?

护城河是什么?差异化打法是什么?

你们商业模式是什么?今年打算赚多少钱?

  关于发展周期

  ​image

  我们以为超前了好几年的认知,最后也可能只是超前了几个月。再加上公司小执行慢,到我们做出产品的时候巨头也已经准备好了。作为创业公司,在今天这个时代,要么看的更远一点,做你觉得有5年时间窗口的产品,因为实际时间窗口也许就2年;要么就做小而美,巨头肯定不想啃的骨头。

  ‍

  AI会从4个阶段改变生活和工作。

  • 第一阶段 - AI去改变分发,这已经发生,并且创造出很多千亿级公司
  • 第二阶段 - 自然语言改变UI,这就是后来很快发生的copilot。这个阶段很适用于低频刚需app, 或者场景式搜索,或者信息密集型app。
  • 第三阶段 - Agent作为新的软件形态,这就是最近发生的GPTStore。这是聊天作为UI和生成式AI结合,实时生成服务和内容,以Agent和chat UI提供给用户。
  • 第四阶段 - 但是聊天并不是最immersive的方式。就好比人与人在讲话时有时会想在白板上比划比划。所以真正AI-native的交互应该是你一打开电脑,界面是一张白板,你画出或描述你的工作流,AI可以自动创建这样的软件给到你。这就是Canvas。而真正的AGI,就像made-to-order于制造业一样,会重新改写供给与需求的关系

  一直到移动互联网时代,创业者还可以因为认知更超前打一定的时间差,但现在AI极大降低了创新门槛,让数据、设计都不再像以前那样可以差异化,剩下的壁垒就只有规模(客户、用户)、资本、供应链这些优势。无论在技术还是产品上,创业团队多数时候只是帮助大厂探路罢了。

  ‍

  ​image

  如果把大模型比作大脑前额叶,负责计算,那么Agent也许更像整个大脑,有记忆,规划,行动,和使用工具的能力,包括搜索、管理日历,等等。你可以上传知识和文档,让它更好的代表你,也可以用它的自主性训练它自动写代码和完成复杂任务的能力。所以对比大模型,Agent更像一个完整的app。想象一下你要去健身,现在你需要打开健身app,选择时长、要健身的部位、周边仪器、难易程度... 这么一套点击下来几分钟没了,更别说选择困难症或者不熟悉app的情况。在Agent时代,你的虚拟健身教练直接帮你计划一套适合你的课程,每天提醒你上课,实时演示给你看,帮你矫正错误动作,锻炼完还帮你点餐,指导你的饮食。Agent时代的人机交互就像人与人的交互一样,更自然,更沉浸,更个人化。最近Bill Gates的发言也说明了AI agent的前景: Preference + automation作为基本的闭环元素。

  GPT Store就是想打造API+OS+硬件+芯片 的超级帝国,AI时代的OS会拥有比iOS更强的壁垒

  在现有的移动端,每个App还是可以内嵌GPT作为chatbot,就像Copilot。但Copilot不是最好的方式,因为你还需要进入app里面,而且每个copilot的天花板还是app的walled garden - 淘宝的就只有购买数据,飞猪的就只有旅游数据。就像我在文章最前面提到的,copilot只是第二阶段。agent的到来是第三阶段。

  • 首先,供给会大量膨胀。科技的作用就是增加供给,就像移动互联网时代的App数量比PC时代的软件数量多,AI时代的Agent数量对比App又会暴增。但供给越多,对于中心化的分发就越是依赖。所以未来的分发权,比现在会是更大的生意。
  • 与此同时,在AI时代会产生一个前所未有的飞轮 - Data to intelligence。商家和开发者为了制作AI员工,会上传自己的服务和数据;用户在和AI对话的过程中也会帮助AI学习提升。

GPTStore的悖论

  任何平台都避免不了的 - economic mobility。你认为Agent究竟是分散的还是集中的市场?

  现在的GPT对token有限制,且喂进去的数据越多反而表现力越差。这就意味着一个Agent不能做到无限多事情。需要多个agents,就像这个世界有许多理财顾问、法律顾问,不仅仅因为每个人供给有限,也是因为术业有专攻。从供给角度说,会需要许多许多agents,每个专注在一个特定领域,甚至理财顾问都可以分出许多不同投资理念的专家。

  但一个人的注意力不能分散给无数agents。移动互联网时代,90%的app在下载后仅仅被打开过一次就没有再被用过。何况对比app的一目了然,用户要和agents聊才能知道他们的能力 - 验证门槛更高。所以从需求角度来说,agents必须要更中心化。

  那就意味着大量agents得不到关注。除非有agents之间能自动协作。比如一个健身教练agent自动找到适合的膳食专agent,和膳食agent协作一起帮用户制定和指导健康计划。

  这还是会带来两个问题:

  1. 成本大幅上升,因为市场上会充斥着大量UGC低质agent,健身agent需要在GPTStore广撒网,发布同一个prompt, 才能筛选出适合的膳食agent来协作;
  2. 变现很难,因为协作模式会导致按月订阅不可取(大量agents是一次性消费),更合理的是收取服务佣金,或者按每次对话付费。佣金在短期内很难,因为目前阶段AI的服务无法闭环。按对话付费有可能,但ROI不太高,收入天花板也会有限(试想Apple不收过路费了,按流量收费)。

  而且无论是哪种状况,只要供需存在这么大的失衡,就意味着有其它平台的机会,就像有Amazon还有Shopify,不同分发机制能有不同平台承载。

AI赛道的终局猜想

  • 硬件形态现在还没有统一认知:下一代硬件来临时间还早。我们离离开手机的时间还早。硬件会有更多形态,也会有不同LLM,不同OS

      1. OpenAI过往的投资都是为了获取更多数据;
      2. 现在的大模型缺乏对现实的理解,需要补上这个能力
  • 硬件+OS会有一超多强的格局:移动互联网时代各大OS的差异化点还是在交互(包括硬件)、品牌、生态。AI时代,硬件、交互、大模型能力、生态、品牌、算力,会有更多的考虑因素。还会有一些小而美的硬件+OS,他们的差异化点可能是更好的数据隐私保护,或更开放的生态

  • 中间层的机会:未来多种硬件和大模型、私有化和非私有化部署,只会更加复杂。这就是面向开发者的中间层的机会 -- 兼容不同大模型,统一标准,一站式开发Agent并部署到不同平台。另外还有上面提到的不同分发逻辑的垂类Agent store,可以作为面向用户的中间层机会。

  • OS会很像微信:左边有各种AI agent,包括你的personal AI, 像人一样可以联系他们,与他们聊天。聊天界面可以打字、语音、voice call, 以及使用各种程序,在聊天界面直接画画。在移动端它像微信,在工作流它像钉钉/飞书,但不变的是发信息成为最主要的command机器的方式。上面聊到Agent市场的最终形态,以及Agents的分发,我们类比微信好友列表以及搜索好友,就可以有更具象的感知了。

  • 是否存在AI-native的垂类应用:今天的平台(淘宝、携程)起到的中心化排序推荐的作用,将来会被OS自身的个人AI助手替代,而各个应用的壁垒,就变成供应链和供给端的内容。比如你让AI助理帮你买新年礼物给各位朋友,它可能把适合的东西都放到淘宝购物车,然后给你展示购物车页面让你最终确认下单;或者在OS聊天框里,各种agent给你推送购买消息。无论哪种方式,重要的不再是各个app的UI和智力,而是供应链。AI会进一步缩减供应->需求的路径,供应商可以自己训agent,直接通过agent把货品和服务给到终端用户。

  • 创业公司的机会:上面说到的都是非常非常宏观的猜想。对于创业公司,机会还有很多很多,比如Gleen.ai,做企业服务;比如给一人公司做工作台OS,一个完全AI-native的钉钉;比如可以接入所有大模型的Agent框架,可以开源,或者做成平台,让大家来创建之后发布到不同的OS和硬件;比如更好的数据存储和传输解决方案;比如给应用和个人做定制化开发。

  ‍

一些创业机会

  • 在不同LLM和硬件之间做用户信息/数据隔离和传输,尤其是非结构化、无标签的数据
  • 更好用的AI-native的界面,让开发者接入自己的agents
  • LLM以外的其它AI能力 - 虚拟人、文生图、视频、实时翻译、语音、3D等等
  • 能结合human in the loop的AI应用或操作台
  • 帮助开发者更好发现和连接供应端的服务商,以及帮助供应端更好开发的开发者
  • 托管各种模型和数据的平台 (LLM agnostic)
  • 深度创建Agent的开发者工具,或者简易创建的模版类工具 --- 可以理解为Agent的Shopify
  • Agent的各个组件的'淘宝’,包括各种知识库、API、workflow模版、虚拟形象、声音、prompt
  • AI社交/内容赛道

  ‍

给想创业的同学的建议

  • 关键在于技术是否能带来9x体验提升。
  • 技术没有达到临界点,需求就不存在。大模型也是一样,模型参数到达临界值,真的能涌现出AGI。而AI的时代,技术成熟的那一刻,之后的进度条就会爆发式推进。

  什么是壁垒:

  技术迭代的本质是创新门槛变低壁垒变弱。AI让通用数据、UI设计的差异化都变弱了,也让开发成本变低很多。当创新壁垒降低时,资本就会是非常有效的壁垒。

  另外但是人的注意力永远是最稀缺和有限的,人的懒惰也永远会越来越厉害。所以switching cost还是有的,品牌、记忆、连接,这些就会构成更强的壁垒。

天时地利人和,天时是第一

  最好的做法就是不停地蓄力,活下去,看更远,保持组织韧性,去等待属于你的‘天时’。

  创业要选择自己不用费力就能做的事:

  打工人要不停挑战自我,但初次创业最好还是选择自己的舒适区,做自己70%努力就能够得着的事,不能好高骛远,靠梦想和自信强撑。

  很多事情创业之前预料不到,真躬身入局了才知道原来大部分时间要处理自己之前没预料到的事。于是你用仅剩的30%的精力还要去做一件超越能力范围很多很多的事,这个stretch就不太可持续了。

  ‍

  抓住不变量--人们经常问我10年后哪些会改变?但几乎没人问我10年后什么不会变。

  抓住什么不会变才能做得好。比如用户会越来越懒,要求越来越高,注意力会越来越稀缺,供给越来越多,链路越来越短,时间和认知差越来越短,交互越来越自然、个性化、沉浸。。。还有一个恒定不变的,就是创新者窘境里面提到的:既得利益者会为了维护既得利益和生态圈,尤其是现有客户关系,而错过颠覆自己的机会。

  打败对手不在于抓住它的缺点,而在于看它的优点能带来什么反面,因为缺点易改,优点难改。结合上面这两个点,应该能找到很多创业团队的机会。

  ‍

  ‍

0

评论区