boj
boj@c7.io

https://www.zhihu.com/question/1974931646080836522/answer/1985650663905055367?share_code=hxtVp17udh7c&utm_psn=1985998499968479861

阶跃星辰Yibo大神的分享!
Step-GUI是很好的工作,8B模型在多个computer use benchmark上达到SOTA水平,但我在NeurIPS上讨论的时候,一些做computer use的朋友竟然没听说过这个工作。
Step Audio 2和Step Audio R1也是很好的工作,8B的开源版Step Audio 2 mini就达到了超过GPT-4o的能力,Step Audio R1也是第一个支持思考的端到端语音模型。但NeurIPS上很多人一样没听说过这两个工作。

酒香也怕巷子深啊!这么说来,Kimi 2023年烧这么多钱投流也许不是错的,虽然用户没全留下来,但Kimi这个品牌至少立住了。Kimi的一位朋友说,在大厂高薪挖人的当下Kimi团队仍然保持稳定,主要是靠Kimi的个人魅力和大家的信仰。

December 21, 2025
boj
boj@c7.io

https://cursor.com/2025
竟然只击败了 96% 的用户,不科学啊!剩下 4% 都是怎么用 Cursor 的神人啊 😂

December 21, 2025
boj
boj@c7.io

今天下午很荣幸在智能体网络与应用创新大会分享了些对Agent人机交互的思考。我接到邀请的时候还以为是要讲网络优化,结果主办方说智能体网络不是传统网络,我就把之前没讲成的Her = 实时语音交互 + 生成式UI + Agent-Native OS讲了。
https://01.me/2025/12/next-frontier-of-agent-human-interaction/

会议收获:
1. 没想到国内做Multi-Agent互联协议、身份授权和支付的这么多。未来每个人一个agent,每个应用(服务)也是一个agent,agent之间通过协议交互,agent通过稳定币支付,已经成为小圈子共识了。
2. 豆包手机这种入口级Agent吃掉传统App,重塑流量分发和广告逻辑,也已经是小圈子共识了。豆包手机才卖出去几千台,微信就紧急封杀。大多数传统App只有抓紧做出agent,支持跟用户交互、跟其他agent交互,才能在agent生态中抢占生态位。
3. 通过大小模型结合和各种工程方法,常见手机应用上的Computer Use也已经走出实验室,可以推广到普通用户了。

December 20, 2025
boj
boj@c7.io

https://01.me/2025/12/silicon-valley-ai-insights-2025/

下午在 AWS re:Invent Beijing meetup 上分享了一些硅谷AI见闻,AWS的活动组织者说从来没见过一次分享这么多干货内容的。感觉OpenAI,Anthropic,Google Deepmind的人才密度确实很高,很多信息在硅谷小圈子里众所周知,但圈外人就不知道。stay relevant非常重要。但同时,转了一圈感觉对御三家也祛魅了,并没有那么多黑科技,大家都是靠大量的数据和工程堆起来的。基座模型也只能聚焦大场景,垂直领域仍然要靠领域agent来做细节优化。

December 19, 2025
boj
boj@c7.io

Limitless AI 后续:我自己写的邮件一天没人回,就用Pine AI投诉了一发,Pine又给他们发了邮件,Limitless AI Team前天回我了,让我提供身份信息,不到一天账户就解封了。
AI吊坠除了会议记录这种正事,更重要的是记录生活,比如图3-4是我12月6日晚上坐Caltrain(显示成了中国时区的12月7日),这节车厢里就我一个人,后来上来一对情侣吵架,他们在车厢里差点打起来,还感觉挺害怕的 😂

December 17, 2025
boj
boj@c7.io

UA888 上 WiFi 信号差,时断时续的,刚下飞机就用 Pine AI 投诉了一发,这么快就收到退款了 😀 只要联系客服的时间成本不是问题,很多属于我们消费者的权益都是可以争取的。

December 16, 2025
boj
boj@c7.io

发现我不需要倒时差的原因了:我的睡眠是受光线控制的,我家里一定要厚的不透光窗帘,出差的时候酒店窗帘遮光一般不行,就必须要眼罩或者毛巾盖眼,午休的时候也一样。否则一大早就可能被阳光叫醒。坐飞机的时候戴上眼罩我一般就能睡着好几个小时,因此下飞机之后不困,自然就可以按照目的地时区生活了。比如我前些天刚下飞机就去找几个湾区朋友吃饭,OpenAI 的朋友快聊完的时候才发现我是从中国来的,他说我是商务舱吗,我说我从来都是坐经济舱,他说完全看不出来是刚坐了十几个小时飞机的 😂

December 15, 2025
boj
boj@c7.io

前几天在 Las Vegas Sphere,世界上最大的球幕影院,12K 屏幕,能容纳上万人。因为我经常玩 insta360 和 VR headset,这种球幕体验对我来说倒没有非常特别。因为我买的是最后一排的票,很陡的坡度俯瞰全场(图2),还有点恐高。由于我在的不是中心位置,很多柱子都是弯的(图3-4),就像我把全景图片导出成平面的一样(因此我很少在朋友圈之类地方 share insta360 拍的东西)。最后散场的时候,上千人在等自动扶梯下楼,但只有我一个人走楼梯(图5-6)。
Las Vegas 商场里面真的跟迷宫一样,我那天开完会去 Sphere,志愿者告诉我走商场里面更近,结果我走呀走,好不容易走出来了,一看定位距离 Sphere 1.3 miles(2 公里),而此时演出已经快开始了,外面路很堵也打不到车。然后我就一路 excuse me,15 分钟跑到了 Sphere,演出已经开始,总算在停止检票前 2 分钟进去了 😂 演出结束的时候也是打不到车,我就跑了 25 分钟 2.5 miles 回到酒店 😂

December 15, 2025
boj shared a status by snullp
大松鼠
snullp@c7.io

感谢朋友带飞我也是坐过private charter的人啦!

#飞行日记

December 14, 2025
boj
boj@c7.io

感谢 Google 朋友带逛 & 聊天,下午跟两个朋友一共聊了 5 个小时,感觉 DeepMind 确实很强啊,这么多聪明人在一起还能高效合作,Sergey 和 Hassabis 都懂技术而且 hands-on,做事的方法也很科学,目前看来真没有明显的短板。当然大厂只能做最大的机会,moving fast 和垂直领域细节优化还是比不过 startup。
图3:Google Store 里 Veo 3 生成的视频

December 14, 2025
boj
boj@c7.io

感觉我们 Pine 好像是 AI Agent 里的 Waymo 啊 😂 只有我们帮用户端到端办事,通过知识库和后训练在 customer service 场景下实现极高的成功率,后台没有人类接管了。受限场景 L4 和几乎全场景 L2 完全是不一样的。Waymo 在 San Francisco 接近 1000 辆车了,但渗透率还是比 Uber 相差很远。很多做 agent 的在试用 Pine 之前根本不相信我们能做到 fully autonomous 帮人办事,就像现在也有很多人不敢坐 Waymo 的车 😂

December 12, 2025
boj
boj@c7.io

在 Anthropic 跟几个朋友聊了 4 个小时,第一次感觉到我们可以组建一个世界级的团队,做一点世界级的事情 😂
之前我总觉得我是个半路出家搞 AI 的,怀疑自己只会写几篇 blog,做不出啥在 AI 领域真正有价值的东西。
从 NeurIPS 聊到今天,感觉我们这草台班子真还有点东西。我们是第一个跟自主跟真人交互,能做长流程谈判,帮用户 get things done 的 agent。而且还能从经验中快速学习,实现自我进化。
终于有点 stay ahead of the curve,“拖着世界往前走” 的感觉了,不再自我怀疑会不会被基座模型公司一夜间颠覆,不再怀疑 agent 公司到底有没有价值了。

December 11, 2025
boj
boj@c7.io

前天跟 Benchmark 开会的时候发现 Limitless AI 吊坠不工作了,然后发现 app 上面显示 Account is Restricted 😂 我发邮件 dispute 了但只收到一个机器人回复。然后看了下官网,发现 Limitless 被 Meta 收购之后就停售了,而且 shipping/billing address 是中国的都被立即停止服务了,其他区域的 limitless 也只会继续服务一年。桌面录屏的 Rewind 也停止服务了。
花了 169 刀买的 AI 吊坠竟然只用了半年,这产品就不做了。在这半年里,我没有亲眼见到任何人用这个产品(他们都会好奇的问我戴的是什么),一些朋友听说过这个产品但也没用过。我自己感觉是非常实用的,因为 Plaud 贴在手机背面会让手机变厚很多,而且 Plaud 的录音不是实时上传的,需要手动处理。如果再没人出类似 Limitless AI 的产品,我就去找华强北自己做一个了 😂

December 10, 2025
boj
boj@c7.io

https://mp.weixin.qq.com/s/i2JQg67UMMZCaNR1QoLXOA
登科的文笔很好呀!Takeaways:
1. AI 的各种 hype 很容易让人陷入焦虑:别人家这么多 DAU、ARR,怎么自己家的产品总也不见增长呢?其实 Tiktok 也很在乎那一万个新增用户,也有焦虑和迷茫的时候。我的观点是,只要 stay ahead of the curve,耐心积累,等待下一个 wave,总有能 ride the wave 的时候。最关键的是要真心相信自己在做的事情。

2. 任何从0到1的事情都有很多脏活累活。Tiktok 为了那一万个用户也用了很多看起来不那么高大上的手段。在 FAISys 和 NeurIPS 遇到很多同学,喜欢做 well-defined 的干净问题。干净问题就这么几个,然后就陷入内卷。但解决现实产品中的真问题就能 get hands dirty,实现差异化竞争。feedback loop 很重要。

摘抄两段:
1. 我们看到一个结果,往往会选择美化故事,或者简化过程,所以我以前对任何复盘都带有审慎的眼光,但现在我的心态略有变化,美化也好,简化也罢,我们并不需要还原全部的真相——我也认为后来者其实无论如何都没办法真正意义上的还原真相,只要能够从中获取到某一点,这一点让人心有所感,那它就已经完成了对我们的教化。
2. 从 Piaf 的视角重新了解之前发生的这些事情,让我有点羡慕字节,这不是因为字节产品多厉害,多赚钱什么的,而是因为在最开始的时候,确实有一个朝气蓬勃,充满干劲,又愿意跳进水里扑腾的团队。
3. ​走的道路和之前有所不同,但捷径也许依然不存在——我们需要的是多一点的耐心,找到最好的战友,以及踏踏实实的铆足劲,低头往前冲。

December 09, 2025