Why Pay for Entertainment? Access Thousands of Free Downloads Now!

AI探索指南

Description
关于ChatGPT、Bard等人工智能、思维方式、知识拓展,能力提升等。
Advertising
We recommend to visit

Last updated 2 years, 2 months ago

Last updated 2 years, 2 months ago

Last updated 1 year, 9 months ago

5 days, 20 hours ago

对 agent 的一个暴论:现有 (multi) agent workflow 的模式没有太大价值。Agent 今年(在以吴恩达老师为首的各类大佬的吹捧下)热度很高,但现有的这些所谓的 (multi) agent workflow,本质上是把一个大任务拆分成很多个子任务,每个子任务都有明确的 input 和 output,自己定义一些变量和接口,把这些子任务串起来。这种方式很像是早期的自动驾驶,把感知和规控分开解,或者是上一代的语音助手,把语音转文字、LLM、语音合成这些工作流串起来。

终极的解决方案应该不是这个样子的。现有的 (multi) agent workflow,速度慢先不说,最大的问题还是在接口的地方把信息降维了。这些 input / output 的接口和变量,本质上都是把信息降维到人能理解的维度,这是以高维信息的损失为代价的。每多一层 workflow,损失的信息就多了一次。面对简单问题时, (multi) agent workflow 或许是可行的,但它注定无法解决复杂问题。就好比Waymo 用感知+规控的架构,搭配高精地图,能够在凤凰城和三藩市勉强把本地 L4 跑通,但很难 scale 成一个通用的解法。只有 Tesla 端到端的方案才是自动驾驶的未来。

因此,现有的 (multi) agent workflow方式注定只是一个中间状态,类似自动驾驶中感知+规控+高精地图的拼凑。而最终想要解决复杂问题,需要靠基础模型的进化。当模型能力足够强之后,应该是可以端到端的解决问题。你可以在 prompt 里提示它去使用某些工具,或者采用某些步骤,但应该不需要人为去把 workflow 拆出来。

Agent 的概念依旧重要,但应该回归它更加 native 的定义,即每一个 Agent 应该是独立的智能体,拥有自己的 memory, planning, tool use 等能力,能够端到端地解决问题,而不是需要人类按照自己的理解一口口地把饭喂到嘴里。一个 Agent 就应该是一辆独立的L5 Autopilot 的汽车,而不是一堆弱智 L2 Workflow 凑出来的所谓 multi agents 辅助驾驶杂牌军团。这听起来就很不优雅。

5 days, 23 hours ago
6 days, 4 hours ago

OpenAI 很鸡贼,提前一天开发布会,让 Google I/O 的气势弱了很多。再加上 Ilya 的官宣离职又分走了不少流量。果然今早一早起来,媒体的报道和用户的关注相比昨天要少得多。

但实际上,个人觉得 Google I/O 还是有不少看点。最大的感觉是:Google 在AI 发展的进度上真正追平了 OpenAI。无论是音视频实时助手,还是视频生成,基本上都能够和 OpenAI 同步发布,效果类似(当然 Veo 比Sora晚了三个月,效果看起来还是要稍逊)。甚至 Gemini 1.5 Pro 的 2 million 窗口,LLM 与 Google 原生搜索的结合,以及与智能眼镜等硬件的集成,相比 OpenAI 来说还要更领先一些。整体上,感觉 Google 这头巨兽算是彻底醒过来了,开始处于某种进攻的态势。(当然,实际全面发布时间是个问题。The Information 说 Google 现在在 AI 上的风格是先立牌坊,然后慢慢挤牙膏兑现。)

Google 的这个多模态助手 Astra,尽管在语音的表现力上不如昨天的 ChatGPT,情绪没有那么丰满和 dramatic,但是在延迟响应、实时语义理解上是不输的,尤其是还结合了记忆,感觉上甚至更加实用。

相比之下,OpenAI 昨天的发布会,以及最近的一系列动作,比如传说中和苹果合作,似乎都有“提升用户体验,进而拼命扩大用户量”的感觉,不知道是不是切身感受到了 Google 的威胁,在战略上做出的选择。或许 OpenAI 已经意识到了,单单靠自己很难跨越鸿沟,GPTs 的失败就是例子。

当然,Google 也有自己的问题,当下最大的风险就是如何应对 LLM 在搜索结果中带来的商业化挑战。发布会上,搜索的第一条结果换成了 LLM 的结果,体验上看似变好了,但对商业化的影响是巨大的。这种左右互搏,处理不好就会是自掘坟墓,处理好了就会迎来第二曲线。至少从股价来看,感觉华尔街对于这次 I/O 的故事并不是非常 buy in,还在继续观察。

1 week, 4 days ago
[这个赛道,出海订单接不过来了](https://mp.weixin.qq.com/s/nMI5BmqwZJgMkINVjcff6w)

这个赛道,出海订单接不过来了

小饭桌这篇文章,没有提到这些产品获得稳定流量的方式到底是什么。
哥飞告诉大家,其实就是通过SEO从搜索引擎获取长期稳定流量。
是的,20年前大家就在玩的古老的SEO技术,居然能在AI时代依然有作用。
哥飞当出海鼓励师快要一年了,已经影响很多人去入门学习SEO了。
那要怎么学呢?
哥飞推荐大家学习 https://ahrefs.com/zh/seo 的7节SEO入门课中文版。
但是这个行当很吃经验,你可能看懂了文字,但是不理解为什么要这么做,这时候就需要有个人能够给你讲解,或者答疑。
欢迎来找哥飞,哥飞有着十几年的SEO经验,足够帮你入门,减少学习成本。

1 week, 5 days ago
【人形机器人公司「加速进化」完成 Pre-A 轮融资】

【人形机器人公司「加速进化」完成 Pre-A 轮融资】

5 月 7 日消息,人形机器人公司「加速进化」完成数千万人民币 Pre-A 轮融资,投资方包括源码资本、水木创投、盈港资本。据媒体报道,本轮融资将用于产品小批量量产及市场推广、人才招募以及持续的研发迭代。(36Kr)

2 weeks, 5 days ago
2 weeks, 6 days ago

Arc Windows 版本正式发布,无需资格,所有人都可以下载。

这里下载:https://arc.net/

2 weeks, 6 days ago

这样看来,这个划时代的下一代颠覆性设备应该满足这样的描述:wearable,离脸近,更轻,更多传感器(always and instantly ready的传感器,重要性被严重低估了),更好的网络连接(以便和AI大模型绑定)。可能的候选形态包括眼镜、耳机、项链、帽子等等。Meta Ray-ban智能眼镜本质上就是一个可拍照的音频眼镜,第一代被用户骂惨了,第二代做了改良,加了阵列麦克风和摄像头,但没做显示,所以能维持重量和一个相对过得去的续航,然后支持一定的AI多模态功能,还支持离线。Meta 还正确地控制了用户的预期,因为它上一代产品的表现很一般,所以其实大家的期待并不高。

如果这样一个 wearable device 被搞出来,很可能三年之内就会取代手机,在大众中的渗透率超过 50%。这里的逻辑是每一代计算设备的渗透速度都在加快,互联网用了几十年,智能手机 6 年(iPhone 渗透率超过50%用了 6 年),所以下一代设备的渗透速度一定更快。至于商业模式,目前还不清楚,但只要对用户有价值,一定可以找到靠谱的变现模式。

李楠认为,当前所谓 “AI 硬件” 涉及到两个矛盾的概念,第一个概念是“+AI”,用老东西加上 AI,比如所谓的录音机加AI,它的短期成功概率更高,更确定,类似种地。第二个概念则是颠覆性的“AI Native”,当软件产生决定性变化的时候,硬件应该从零开始为软件的能力重新设计。这种方法的结果不可预测,像是放羊(当然在人类历史上是反过来的,从游牧文明到农耕文明)。用图片处理来举例子,photoshop 就像是种地,是联合收割机,用的是对象、命令、多窗口等经典方法,而 midjourney 就像是放羊,用的是自然语言,是完全不一样的生产力。

最后,李楠对其他 AI 硬件的评价:

- AI Pin:灾难性的产品,基础体验不好是其次,最重要的是产品定义错了,做了太多的加法。三年以内,所有带显示的AI设备都是要扑街的。

- Rabbit R1:大概率会扑街,它的产品定义不清楚,不能用一句话清晰的说明白。另外,它的革命不彻底,还是基于 GUI 的假设来做交互,用虚拟机来模拟 GUI ,但 GUI 是给人看的,不是给 AI 看的。在 AI 时代需要更加颠覆性的底层解决方案,比如 Stanford 的 Octopus 团队,跳过 GUI 应用层直接写脚本,模型更小,执行效率更高,速度更快,功耗更低。

- Apple Vision Pro:傻逼产品, 太重了。

- Rewind Pendant:已经成功了。产品定义就是 AI+录音机,做 Memory 的记忆和增强, 非常清晰。

4 weeks ago

今天和团队一起肝了两周的豆包客户端 AI 划词功能终于上线了,她能帮你在选中文字后能提供AI 搜索、翻译、解释、总结等各类 AI 辅助功能,让桌面上的其他应用都提前接入 AI 。 当前完全免费,大家阔以来试试,给些反馈...
下载地址:https://www.doubao.com/download/desktop

We recommend to visit

Last updated 2 years, 2 months ago

Last updated 2 years, 2 months ago

Last updated 1 year, 9 months ago