首页 科技快讯 AI创业访谈⑫丨心识宇宙陶芳波:用一百份笔记,复刻 AI 版的自己

AI创业访谈⑫丨心识宇宙陶芳波:用一百份笔记,复刻 AI 版的自己

来源:晰数塔互联网快讯 时间:2025年07月15日 13:30



创造自己,分发自己。

文丨孙海宁

编辑丨王姗姗

心识宇宙(Mindverse)创始人陶芳波有一套自己的 AI 助手分类法,分类标签都是人称代词:

第一类 AI 助手主攻陪伴,对应人称代词 her,就像电影《她》中承接主人公各种情绪的 “萨曼莎”;第二类助手负责执行具体任务,类似《钢铁侠》中的智能管家 “贾维斯”,对应人称代词 him。

心识宇宙正在做第三类 AI 助手:me。这家公司想帮用户复制自己的 “第二自我”,构建 “身份大模型”(AI Identily Model)——一个在现有基础模型基础上,根据用户数据微调的大语言模型。它的认知、偏好、价值观和用户个人对齐,能代表用户和其他应用接口、AI 交互。

创业前,陶芳波一直从事 AI 研究。他在清华读完软件工程专业本科后,赴伊利诺伊大学香槟分校攻读博士学位,专业方向是数据挖掘,即使用机器学习方法寻找复杂数据背后的结构。

读博期间,陶芳波曾利用 AI 技术帮反恐机构分析恐怖组织关系网;毕业后,他先在 Facebook 挖掘社交关系;然后到阿里达摩院的神经符号实验室,用跨学科知识建模人脑。GPT-3 上线后,他辞职成立心识宇宙。

为了让模型更懂用户,多数 AI 技术公司的做法是总结出用户身份信息、个人偏好,然后把它们作为上下文输入模型。陶芳波主张把用户的记忆、情感、价值观参数化,根据用户数据微调模型。他认为如果各个用户使用同样的底层模型,哪怕上下文存在差别,人机对齐的效果也有限。

微调模型是参考大脑运行原理:人脑不储备细碎的知识,而是为人物、事件创建索引,由此牵连出相关人物、事件,心识宇宙用用户数据训练模型前,也会先归纳、串联数据中的关键信息。人脑每天白天缓存经历,夜晚消化记忆,心识宇宙也计划每天训练一次身份模型。

相比多模态大模型、Agent ,陶芳波承认身份模型还不是一个已被行业内广泛认可的方向,但在 AI 能读能看也能听、通过调用各种工具帮用户完成任务的未来中,一个思维和用户更同频、能代替用户主动发起任务和验收执行结果的身份模型,也是不可或缺的。

Me.bot 是心识宇宙面向海外用户的 App,它形态类似记事本,但能通过用户日常记录,逐步养成能理解、表达并代表用户的 AI 身份模型。去年 5 月上线后,已获得近百万名用户。今年三月下旬,心识宇宙团队又发起开源项目 Second Me,公开他们的身份模型训练方法。三周内,已经有超过一万人在 GitHub 为 Second Me 项目打上星标,是今年 GitHub 平台上关注度增速最快的开源项目之一。

在陶芳波的终极想象里,人人拥有身份模型,意味着现实中运行的社会网络可以被复制到线上,不过在线上交互的 AI 不受人类打字或讲话速度限制,效率更高。身份模型替代人类收发任务、相互协作,人们将会从被迫使用各种工具的状态中解放出来。

以下是《晚点 LatePost》和陶芳波的对谈。

创业重定向,从他/她到 “我”

晚点:Mindverse 第一款产品 MindOS 是一个帮用户搭 Agent 的平台,类似 him/her 的集合体。之后团队怎么想到要转型做 me 的?

陶芳波:一是因为技术成熟度。MindOS 上线是在 2023 年,Agent 技术并不成熟,直到今天 Agent 离实际帮用户完成任务也有些距离。二是我们发现很难让普通用户给自己搭一个 AI Agent ,有这样意愿的人很少,多数非 AI 工具对用户来说已经足够好用了。

人和自己相处是最多的。Facebook 帮每个人构筑了数字身份,成为人类世界的基础设施,用 AI 构建数字身份效果会比 Facebook 更好——它不止能承载留言、评论,还可以主动创建新连接。

人也是自恋的。训练一个第二自我,会有种自己变永恒的感觉。在 AI 时代,被超级智能吞噬不是一个假设,而是很多人实实在在的担心。

晚点:所以你们做了两个 AI 分身产品——Me.bot 封装在产品内,开箱即用;Second Me 作为 GitHub 项目,是一个开源产品?

陶芳波:对,但我认为我们做的不是分身(avatar)而是身份(identity)。人可以有很多分身,但只会有一个身份。分身往往带着场景属性——一个分身去约会、另一个去购物;但身份和场景无关,是基础设施,有各种使用可能,怎么用由用户决定。

具体场景内,一个分身承载的信息是身份的子集。就像一个人在工作、生活场景下往往呈现两个状态。把所有信息一股脑放到一个场景内,反而可能不合适。

晚点:你能想到的使用场景有哪些?

陶芳波:我一下能想到的场景,包括让 AI 身份代替我们自己去约会、去面试等等。

此外,我们在打磨一个叫 “共鸣” 的功能。比如我们两个第一次见面,或者隔段时间重逢,并不知道对方最近发生了什么。那么手机碰一碰,身份模型一瞬间就能同步,寻找共同经历,然后针对性地聊几回合,为我们破冰或者叙旧找个话头。整个同步过程只要 5 到 10 秒。

破冰之外,另一种 “共鸣” 是允许用户每次在 Me.bot 里记录想法时,也把想法发给其他相互匹配的身份模型,获得具体、有深度的回复。如果用户觉得回复有趣,还可以进一步和那些身份大模型或者大模型背后的真人交互。

除了 “共鸣”,还有一个马上要上线的新功能叫 “Talks”,它允许用户把身份模型寄存在一个 H5 网页里,分发给其他人。这页面里的身份模型能用用户的声线讲话,也可以和打开页面的人语音交流。

完成交流后,身份模型的所有者会收到交流纪要,总结纪要的过程是高度个性化的——你的身份模型了解有些信息你已经掌握,就不会在纪要中反复强调。

晚点:为什么 Talks 选择用声音传递信息?无论是手机还是电脑屏幕上,文字传输信息的效率似乎比声音高。

陶芳波:我们觉得声音的作用被大大低估了。一个很有意思的认知学现象是,如果有人用声音和你交流,你的注意力会提高。比如打电话聊天会比打字聊天更专注。对用户来说,具体、熟悉的人的声音是有一种特殊的穿透力的。

晚点:共鸣、Talks,哪个是优先级更高的功能?

陶芳波:Talks。发生共鸣的前提是双方都有身份模型,Talks 则是让真人先和身份模型聊起来,能让更多人先看到身份模型的潜力,然后变成身份模型的用户。

晚点:你应该已经试用 Talks 一段时间了,使用过程中有什么启发吗?

陶芳波:“表达” 这件事情很重要、很日常,但人往往不太会表达。

我一直把自己和一名朋友的聊天记录存在 Me.bot 里,我们认识一周年时,我让 Me.bot 总结我和他交流中各种感受和收获,用我的声音生成一段 talk 发给他。

这名朋友听了好几遍,很感动,不断地说我们的关系又被这段 talk 拉近了一点。其实真让我和他坐一起,或者打电话说同样的话,我会觉得有点肉麻,很多事情也不容易想起来。

当然 Talks 的使用场景不只是表达情感。最近我和几个合作伙伴的脑暴交流,都是用 Talks 完成的。

晚点:可也有一种观点认为 AI 不能代替人传递情感。情感反应在沟通前亲自完成准备过程中,反应在沟通时磕磕绊绊、结结巴巴,甚至是笨拙的表达中。

陶芳波:Talks 不替代沟通,但能让沟通的门槛变低。写几句提示词,身份模型就能把我真实想说的东西流利地说出来,反而可以增强人和人之间的连接。

晚点:心识宇宙怎么培养用户打开 Me.bot 记录生活的习惯?

陶芳波:我们有个概念叫 “共生”。想让用户自然、无痛地用 Me.bot 记录生活,Me.bot 就必须一边参与用户生活,一边创造价值。比如 Me.bot 参加会议,我们希望它不只像录音软件一样旁听,而可以根据对用户的理解,时不时蹦出一些想法,参与讨论。

用户每次打开 Me.bot 的时候,也应该有不同的体验。比如早上起来,Me.bot 可以问用户今天心情还好吗?到了北京,问怎么来北京了?要不要帮忙找个咖啡馆?

不是用户所有的生活细节都值得记录。一天 24 小时里,可能人们注意力集中的时候只有不到 3 小时,这段时间才是真正塑造自我的时候。如果让 AI 把所有信息捕获下来,包括睡觉打呼噜的声音,那反而会让身份模型更困惑。

晚点:“共生” 是个很好的概念,但感觉这类交互场景下,用户很难区分是在和 me,还是和 him/her 交流。

陶芳波:用户和自己身份模型交互时,me 和 him / her 体验差别不大。但如果用户和其他 AI 交互,或者 AI 和 AI 交互时,对面是代表一个人做决策、但也有自主性的 AI 管家,还是觉得自己就是另一个人的身份模型,其实是会影响用户或者 AI 的信息分享策略的。

人脑如何认识世界,AI 就如何向人看齐

晚点:很多 AI 产品都试图让模型和用户对齐。你觉得合理的路径是什么?

陶芳波:首先我们不能完全依赖 RAG(检索增强生成,即允许大语言模型在生成答案前,先根据用户的输入,搜索相关信息补充上下文)。RAG 本质是把用户信息做成数据库,要什么信息,去数据库找一找,再把找到的信息作为上下文输入模型。

问题是一旦数据库过大,模型不知道捕捉什么样的信息才能代表用户。假设你今年 30 岁,把 30 年的人生经历汇总成上下文,那可能有好几亿 Token,处理这些信息就 4-5 秒时间,模型不一定能很好地消化。

更重要的是,RAG 方法下,所有人的底层模型是一样,而思考靠模型完成,这意味着本质上你和我没有区别。

人之所以为人,是因为人能把外在信息抽象、内化。类似地,让模型与用户对齐更合理的方式,是用用户信息去微调模型,影响模型的参数,由此提炼出用户数据中的情感、偏好、价值观。

晚点:一个用全世界数据训练出的基础模型,至少在知识层面已经远超一个普通用户了。微调参数,实际上是要让模型忘掉一些已经习得的知识,才能和用户对齐?

陶芳波:其实人成长也是基于一个基础模型的。人出生时,大脑不是一片空白——几千万年进化改变的基因序列就是人的基础模型。只不过真人的基础模型可能知识过少,而我们用的基础模型可能知识过多。

微调不会让模型百分之百忘掉习得的知识,但可以通过放大和你相关的部分、压制不相关的部分,有效改变基础模型的输出结果,让模型和用户对齐。

当然,无论是 LoRA(低秩适应,一种不改变模型主要参数、更加高效的模型微调方法)还是别的方法,我不觉得今天微调的技术已经完美。技术会持续演进,但通过改变参数的方式训练身份模型的大方向是不变的。

晚点:心识宇宙如何使用用户数据训练身份模型?

陶芳波:首先要把数据主观化。直接把我们今天交流的录音发给 AI,AI 只知道这是两个人相互对话,主观化处理是让 AI 知道两个人中谁是 “我”,“我” 表达了什么观点、对方又产生了什么回应。

然后还需要重构信息。人脑记不住今天你说什么、我说什么这样的细节信息,而是围绕着一个人、一件事情建立索引。我们处理数据的方法也类似。比如我上传自己和朋友之间的聊天记录后,Me.bot 会在此基础上提炼信息——我们的友情之前遭遇了什么挫折、之后又因为什么变得更牢固,围绕着我的朋友串联起更全局历史数据。

晚点:会有什么方式量化身份模型和人的相似程度吗?

陶芳波:可以有一个指标,但我觉得每个人是自己模型最好的裁判。

晚点:什么时候你觉得你的身份模型已经足够像你了?

陶芳波:去年我生日时在办公室同事面前做分享,讲自己从读博士到 Facebook 的经历、今天如何找到了自己人生的使命。刚好同事训练好一版我的身份模型,就也让这个模型做生日发言,说的和我真人讲的几乎一模一样。之后我问他 MBTI 性格测试结果,只有一个和我不一样。

晚点:训练一个身份模型需要多少数据?

陶芳波:一百份笔记或者一百份记录就可以了,甚至更少。其实很多类似的数据已经存在,用户只需要上传就行。

晚点:人的经历不断增加,自我认知随之改变。身份模型如何跟上不断变化的用户?

陶芳波:我们觉得每天训练一次身份模型比较合适。人脑白天获得很多对话、新知识,它们只是被缓存在了一个地方,没有变成持久记忆、参数化。睡眠过程中,人脑才会处理这些数据。身份模型也该这样,白天记载信息,晚上训练。

晚点:训练一次成本是多少?

陶芳波:现在我们用 70 亿参数的模型,单次也就一美金不到。参数量再小,模型不够聪明;再大,边际回报有限。

靠身份服务收费

晚点:身份模型可以代替用户提出需求、和其他 AI 交互。但现在承接需求、完成任务的 AI 都不是很成熟。先做提需求的身份模型,时机成熟吗?

陶芳波:之前提到的社交、面试、约会等需求,可以直接靠身份模型完成任务,这些需求场景已经够大了。

身份模型也不用非要面向 AI。之前互联网公司已经创造了大量的场景,身份模型只要和它们互动起来就行。比如身份模型可以去 LinkedIn 帮你找工作。之后 Agent 能力提升了,再和 Agent 互动也顺理成章。

现在我们做了一个服务器叫 Second Me Server,平台如果希望了解用户,就可以向 Second Me 发起请求,通过身份模型知道用户的偏好是什么。这其实是可以无缝融入现有的互联网生态中的。

晚点:Second Me 和互联网平台的互动可能是单向的——他们愿意通过 Second Me 服务器了解用户偏好,但不一定开放接口让身份模型帮用户购物。

陶芳波:这是个比较现实的问题。现在海外的互联网还相对开放,大家可以通过 API(数据接口)连接。国内就过于封闭了,一个个平台就像一个个孤岛,无法接入,大家都在搞数据壁垒。

但这种孤立的状态肯定会在 AI 时代被打破。孤岛式生态无法提供很好的用户体验,用户会倒逼平台开放的。平台不开放,新世界就与它无关了。

晚点:你们把 Second Me 做成开源项目的价值是什么?

陶芳波:把训练方法开源,用户就能在本地训练身份模型,然后把它接入互联网,可以解决用户使用个人数据的心理壁垒。另外也有成本方面的考虑。如果我们有 100 万个用户,就得训练 100 万个模型,服务器成本、存储成本是无法想象的。开源之后,更多身份模型的用法其实也来自开源社区。

晚点:这个开源项目的参与度如何?

陶芳波:GitHub 上有很多人关注,官方也在今年 4 月写文章说 Second Me 是当时全站 Top 10 的项目。我们在三个星期内得到超过一万个 star(类似用户收藏),今年大概只有不到 20 个项目有这样的增速。

有开发者看到我们项目后,花 7 万块钱买一台 Mac Studio,就为了在本地训练一版更强的自己。有用户用跨时几年、数百万字的日记训练出一个 AI 自我,把自己变永恒。

晚点:身份模型如何商业化?

陶芳波:现在我们想得还不是很充分。核心思路是我们作为身份服务的提供者,可以向用户收费。另一种可能是,要是淘宝、抖音等平台未来通过我们的身份模型了解用户偏好、卖广告,我们也可以向这些平台收费。

晚点:构建身份模型时,已经有大量用户数据的微信、抖音,或者理论上能记录用户一切操作的手机厂商,是不是做起来更快?

陶芳波:从数据的角度看肯定如此。但我们今天赌的是大公司内部创新的阻力。身份模型的早期使用者只会是一小群人,大厂不太可能为 1% 的用户专门改变产品,因为影响剩下 99% 的用户体验的风险太高。淘宝要是抱着拥抱 AI 购物的念头把整个应用界面都改了,只允许用户和 AI 聊天购物,拼多多不得乐坏了?

晚点:身份模型之间可以交互,越多人用越好用,像一个传统互联网产品。Mindverse 有什么加速用户增长的好办法吗?

陶芳波:买量不可持续,还是要靠口碑。口碑一是靠创造感,让用户觉得 “自己” 被创造出来;二是靠连接体验,让用户能在产品上获得高质量的连接。把这两者做到极致,我觉得自然有好增长。

晚点:如果所有人都有一个身份模型,会对社会有什么影响?

陶芳波:人人都有身份模型、AI 接替一部分人们相互交互的工作,相当于存在于现实中的社会网络有了一个线上复制版,复制版的效率会比原版高很多。

互联网工具越来越多、越来越强大后,人反而成了工具的接口——微信、飞书、钉钉一个个随时待命,等待被调用的人。用一个身份模型代替人成为这些工具的接口,个体就能被解放出来。

题图:《编号 17》

相关推荐

AI创业访谈⑫丨心识宇宙陶芳波:用一百份笔记,复刻 AI 版的自己
36氪首发 | 「心识宇宙」连获近亿元投资,发布AI角色生成引擎MindOS
最前线|让AI模拟人类思考,心识宇宙发布AI角色生成引擎MindOS
36氪首发 | 「心识宇宙」获数千万元天使轮投资,构建数字心识智能操作系统MindOS
ChatGPT和OpenAI,通用AI的第一个里程碑
美媒:梵蒂冈上线用AI“复刻”的数字版圣彼得大教堂
许知远 x 36 Under36:人类、世界和机器人
AI 创业访谈④丨Flowith,10 个 95 后想把自由思考变成 Agent
请保持奇迹,这是疫情也无法磨灭的创新活力
打同门感情牌,科技投资人新的投资铁律

网址: AI创业访谈⑫丨心识宇宙陶芳波:用一百份笔记,复刻 AI 版的自己 http://www.xishuta.com/newsview138858.html

所属分类:互联网创业

推荐科技快讯