来源:https://aigcreative.feishu.cn/docx/BbZfd0KMfooLJ0xSxf8c5SCTnKg
import tensorflow as tf
from tensorflow.keras import layers
生成器
def generator(input_shape, latent_dim):
inputs = tf.keras.Input(shape=latent_dim)
x = layers.Dense(4 * 4 * 256, use_bias=False)(inputs)
x = layers.BatchNormalization()(x)
x = layers.LeakyReLU()(x)
x = layers.Reshape((4, 4, 256))(x)
x = layers.Conv2DTranspose(128, (5, 5), strides=(1, 1), padding='same')(x)
x = layers.BatchNormalization()(x)
x = layers.LeakyReLU()(x)
x = layers.Conv2DTranspose(64, (5, 5), strides=(2, 2), padding='same')(x)
x = layers.BatchNormalization()(x)
x = layers.LeakyReLU()(x)
x = layers.Conv2DTranspose(3, (5, 5), strides=(2, 2), padding='same', activation='tanh')(x)
return tf.keras.Model(inputs=inputs, outputs=x)
判别器
def discriminator(input_shape):
inputs = tf.keras.Input(shape=input_shape)
x = layers.Conv2D(64, (5, 5), strides=(2, 2), padding='same')(inputs)
x = layers.LeakyReLU()(x)
x = layers.Dropout(0.3)(x)
x = layers.Conv2D(128, (5, 5), strides=(2, 2), padding='same')(x)
x = layers.LeakyReLU()(x)
x = layers.Dropout(0.3)(x)
x = layers.Flatten()(x)
x = layers.Dense(1, activation='sigmoid')(x)
return tf.keras.Model(inputs=inputs, outputs=x)
训练GAN
def train(generator, discriminator, latent_dim, batch_size, epochs):
# ...
if name == 'main':
latent_dim = 100
batch_size = 32
epochs = 1000
generator = generator((256, 256, 3), latent_dim)
discriminator = discriminator((256, 256, 3))
train(generator, discriminator, latent_dim, batch_size, epochs)
这个代码实例定义了一个基于TensorFlow的GAN,包括生成器和判别器的定义,以及训练GAN的函数。生成器使用多层卷积层和批归一化层来生成新的图像,判别器使用多层卷积层和Dropout层来区分真实的图像和生成的图像。在训练过程中,生成器和判别器相互竞争,使生成的图像逐渐接近真实图像。
## **5.未来发展趋势与挑战**
AI绘画的未来发展趋势和挑战包括:
+ 更高质量的图像生成:未来的AI绘画模型将更加强大,能够生成更高质量的图像,接近或超越人类的绘画能力。
+ 更广泛的应用:AI绘画将在艺术、设计、游戏、广告等领域得到广泛应用,为人类提供更多的创作和表达方式。
+ 数据和计算资源的需求:AI绘画需要大量的训练数据和计算资源,这将对数据收集、存储和计算技术产生挑战。
+ 道德和伦理问题:AI绘画的发展可能引发道德和伦理问题,如作品权利和版权问题,以及AI生成的艺术作品的价值和意义。
## **6.附录常见问题与解答**
在这里,我们将列出一些常见问题及其解答。
Q: AI绘画与人类绘画有什么区别?
A: AI绘画使用算法和模型来模拟人类的绘画过程,而人类绘画则是通过人类的思维和手术来创作。虽然AI绘画可以生成高质量的图像,但它们可能缺乏人类绘画的情感和个性。
Q: AI绘画可以替代人类绘画师吗?
A: AI绘画可以生成各种类型的图像,但它们仍然无法完全替代人类绘画师。人类绘画师具有独特的创造力和情感表达能力,这些在AI绘画中很难复制。
Q: AI绘画的发展将如何影响艺术领域?
A: AI绘画的发展将对艺术领域产生重大影响,为艺术家提供更多的创作方式和可能性。同时,AI绘画也可能引发道德和伦理问题,如作品权利和版权问题,以及AI生成的艺术作品的价值和意义。
这就是我们关于《6. AI绘画的历史:从古代到现代》的专业技术博客文章的全部内容。希望这篇文章能够帮助您更好地了解AI绘画的历史、核心概念和算法,以及其未来发展趋势和挑战。如果您有任何问题或建议,请随时联系我们。
# AI视频发展史
> 来源:[https://aigcreative.feishu.cn/docx/Pagvdf0j6oXBFNx2wkicxyyznsc](https://aigcreative.feishu.cn/docx/Pagvdf0j6oXBFNx2wkicxyyznsc)
> CSDN作者:v_JULY_v
> 文章:《Sora之前的视频生成发展史:从Gen2、Emu Video到PixelDance、SVD、Pika 1.0》
> 链接:https://blog.csdn.net/v_JULY_v/article/details/134655535
### 早期探索阶段(20世纪50年代-80年代):
学术研究:
+ 1957年,John McCarthy等人开发了世界上第一个AI程序,该程序能够进行简单的推理和计算。
+ 1960年代,Marvin Minsky等人创立了麻省理工学院人工智能实验室,成为AI研究的重要中心。
+ 1970年代,Nils J. Nilsson开发了STRIPS规划系统,为机器人制定行动计划。
军事应用:
+ 1960年代,美国国防部开始资助AI视频研究,用于军事训练和模拟。
+ 1970年代,美国军方开发了SAIL系统,模拟战场环境,用于训练士兵。
+ 1980年代,美国军方开发了DARPA图像理解计划,旨在识别图像中的目标。
### 快速发展阶段(20世纪90年代-2010年代):
技术突破:
+ 1997年,IBM的深蓝计算机战胜了国际象棋世界冠军卡斯帕罗夫,标志着AI在特定领域超越人类智能。
+ 1998年,David Lowe提出了SIFT算法,有效识别图像特征,为AI视频的图像识别和理解奠定基础。
+ 2000年代,AI视频开始在商业领域应用,如视频广告、移动视频等。
商业应用:
+ 2006年,YouTube推出视频广告功能,利用AI技术自动识别视频内容,投放相关广告。
+ 2007年,苹果发布iPhone手机,推动移动视频普及。
+ 2010年代,AI视频技术应用于视频编辑、特效制作、虚拟现实等领域,为视频创作带来新的可能性。
### 深度学习时代(2010年代至今):
技术突破:
+ 2012年,Google推出AlexNet模型,在ImageNet图像识别竞赛中取得突破性进展,开启深度学习时代。
+ 2014年,Facebook推出DeepFace模型,在人脸识别方面取得超越人类的准确率。
+ 2016年,Google推出AlphaGo程序,战胜世界围棋冠军李世石,再次证明AI技术的强大实力。
应用领域:
+ AI视频编辑工具:自动识别视频场景、人物和物体,根据用户需求进行剪辑和编辑。
+ AI视频特效工具:利用深度学习技术生成逼真的虚拟场景和特效。
+ AI虚拟现实技术:创造沉浸式的虚拟体验,为用户带来身临其境的感受。
### **未来展望:**
趋势:
+ AI视频生成技术更加智能,根据用户需求生成个性化视频内容。
+ AI视频编辑技术更加高效,自动完成视频剪辑、特效制作等工作。
+ AI视频应用更加广泛,应用于教育、娱乐、医疗、商业等各个领域。
具体应用场景:
+ 教育: 个性化学习,提供定制化的学习内容和体验。
+ 娱乐: 游戏、电影、音乐等领域,创造更加逼真、沉浸式的体验。
+ 医疗: 医学影像分析、手术模拟等领域,提高诊断和治疗的准确性。
+ 商业: 产品展示、广告宣传、客户服务等领域,提高营销效果和客户满意度。
## **总结:**
AI视频技术是一项快速发展的新兴技术,它为视频创作带来了新的可能性,并将在未来各领域发挥越来越重要的作用。
专业性增强:
+ 增加参考文献和数据来源,增强内容可信度。
+ 使用专业术语和理论,提升内容专业性。
+ 对技术细节进行深入分析,展现专业深度。
注意:
+ 保持内容客观公正,避免主观臆断。
+ 避免过度宣传或炒作,理性看待AI视频技术的发展。
+ 关注AI视频技术的潜在风险和伦理问题,促进技术健康发展。
# AI语音发展史
> 来源:[https://aigcreative.feishu.cn/docx/UdZfd2c5To2S5Jx8lpwc8xyOnkh](https://aigcreative.feishu.cn/docx/UdZfd2c5To2S5Jx8lpwc8xyOnkh)
人工智能语音技术的发展历程大致可以分为以下几个阶段:
1. 早期探索阶段(1952-1970年代)
这一阶段的研究主要集中在语音识别的基本原理和技术上,取得了一些初步的成果,例如:
+ 1952年,贝尔实验室研制出世界上首台自动数字语音识别机“Audrey”,能够识别数字0-9的发音。
+ 1956年,普林斯顿大学RCA实验室开发了单音节词识别系统。
+ 1959年,MIT的林肯实验室开发了针对十个元音的非特定人语音识别系统。
+
1. 快速发展阶段(1980-1990年代)
这一阶段,语音识别技术的理论和方法取得了突破性的进展,隐马尔科夫模型(HMM)成为语音识别系统的基础模型。同时,语音合成技术也得到了快速发展,能够生成较为自然的人类语音。
1. 商业化应用阶段(2000-2010年代)
随着语音识别和合成技术的成熟,语音技术开始在各个领域得到广泛的应用,例如:
+ 语音输入:手机语音输入、电脑语音输入
+ 语音控制:智能家居、车载语音控制
+ 语音服务:语音导航、语音客服
+
1. 人工智能赋能阶段(2010年代至今)
随着深度学习技术的兴起,人工智能技术为语音技术的发展带来了新的活力。深度学习模型在语音识别、合成、理解等方面取得了突破性的进展,使得语音技术的性能和体验得到了大幅度提升。
**AI语音技术的未来展望**
未来,AI语音技术将继续发展,并在以下几个方面取得突破:
+ 语音识别更加准确、鲁棒
+ 语音合成更加自然、流畅
+ 语音理解更加智能、深邃
AI语音技术将为人们的生活带来更加便捷、高效、智能的体验,并将广泛应用于各个领域,例如:
+ 教育:个性化学习、智能教学
+ 医疗:远程医疗、智能问诊
+ 客服:智能客服、虚拟助理
+ 娱乐:智能音箱、虚拟陪伴
AI语音技术将改变人们与机器交互的方式,并为人类社会带来新的变革。
**以下是一些重要的里程碑事件:**
+ 1952年:贝尔实验室研制出世界上首台自动数字语音识别机“Audrey”。
+ 1971年:美国国防部启动了五年期限的语音理解研究项目,希望将识别的单词量提升到1000以上。
+ 1980年代:隐马尔科夫模型(HMM)成为语音识别系统的基础模型。
+ 1990年代:语音合成技术快速发展,能够生成较为自然的人类语音。
+ 2000年代:语音技术开始在各个领域得到广泛的应用。
+ 2010年代:深度学习技术为语音技术的发展带来了新的活力。
+ 2020年代:AI语音技术将继续发展,并在各个领域取得突破。
**一些重要的公司和机构:**
+ 贝尔实验室
+ 卡内基梅隆大学
+ 麻省理工学院
+ IBM
+ 微软
+ 谷歌
+ 科大讯飞
# 综合内容
> 来源:[https://aigcreative.feishu.cn/docx/QI9hdvJw6oMJ0exLAJacspvNnDh](https://aigcreative.feishu.cn/docx/QI9hdvJw6oMJ0exLAJacspvNnDh)
# 知识库动态
# 2024世界500强构建与采购生成式AI的16个变化 | 猎人翻译
> 来源:[https://aigcreative.feishu.cn/docx/TTEIdrXzboqaymxFcDdc6GOQn2e](https://aigcreative.feishu.cn/docx/TTEIdrXzboqaymxFcDdc6GOQn2e)
> 链接:https://a16z.com/generative-ai-enterprise-2024/
> 翻译:创意猎人-Kevin
生成式AI在2023年迅速席卷消费者市场,消费支出迅速突破十亿美元大关。到了2024年,我们预见其在企业领域的盈利机会将会是消费市场的数倍。
过去一年里,消费者或许沉浸在与AI伴侣的对话中,或忙于使用扩散模型创作图像和视频,但企业对生成式AI的探索似乎只局限于几个显而易见的应用场景,并推出了一些简单包装的“GPT产品”。有人质疑,生成式AI是否真的能拓展到企业领域——我们是否只停留在那几个旧有的应用场景?这些初创企业真的能从中盈利吗?或者这只是一场泡沫?
然而,最近几个月,我们与众多财富500强和顶尖企业的领袖进行了交谈,并对其他70多位进行了调研,以深入了解他们如何采用、购买及为生成式AI设置预算。令人惊讶的是,这些企业对生成式AI的资源投入和态度在过去六个月里发生了翻天覆地的变化。虽然这些领导者对部署生成式AI仍持保留态度,但他们的预算几乎增加了三倍,扩大了在小型开源模型上部署的应用场景,并且将更多实验初期的工作负载转入了生产阶段。
这为创业者带来了前所未有的机会。我们认为,那些能够针对企业AI中心战略项目构建解决方案、预见并解决它们痛点的AI初创企业,以及那些从依赖服务向构建可扩展产品转变的企业,将能捕获这波新的投资浪潮,并在市场中占据重要地位。
正如历来面向企业构建和销售任何产品一样,深入理解客户的预算、顾虑和规划是关键。为了帮助创业者深入了解企业领袖在部署生成式AI时的决策过程,以及为AI高管提供一个了解同行如何应对共同挑战的窗口,我们汇总了与这些领导者近期交谈中关于资源配置、模型选择和应用场景的16个核心考量。
# 资源配置:预算正大幅增长,且这一趋势看似将持续
## **生成式AI的预算急剧上升。**
2023年,我们交流的众多公司在基础模型API、自我托管和模型微调上的平均支出达到了700万美元。更令人注目的是,几乎每一位与我们对话的企业负责人都表示,鉴于生成式AI实验的初步成功,他们计划在2024年将支出增加2到5倍,以支持将更多工作负载投入生产。
## 领导者开始将AI投资转移到常规软件预算中。
去年,企业在生成式AI上的投资大多来自一次性的“创新”预算。但到了2024年,许多领导者开始将这
些资金转移到更为持久的软件预算项目中;不到四分之一的受访者表示今年的生成式AI开支还会来自创新预算。我们还看到一些企业开始将生成式AI预算用于节约人力成本,尤其是在客户服务方面。这被看作是未来对生成式AI支出大幅增长的预兆。一家公司提到,通过使用基于LLM的客户服务,每个来电可节省约6美元,总节省成本达到约90%,这是他们将投资于生成式AI的资金增加8倍的原因。
下面是不同组织如何分配他们的LLM支出的大致情况:
## 3. 衡量投资回报(ROI)仍旧是艺术与科学的结合。
企业领袖目前主要通过AI带来的生产力提升来衡量ROI。尽管他们依赖于NPS和客户满意度作为良好的间接指标,但他们也在寻求更具体的衡量回报的方法,如收入增长、成本节约、效率提升和准确性改进,具体取决于其应用场景。目前,领导者们还在推广这项技术,并尝试找出最佳指标来量化回报,但在接下来的2到3年里,ROI将变得越来越重要。在寻找答案的过程中,许多人信任他们的员工报告说,他们能够更好地利用时间。
## **4. 实施和扩展生成式AI需要正**确的技术人才,目前许多企业内部并不具备。
仅有模型提供者的API远远不足以在大规模上构建和部署生成式AI解决方案。这需要高度专业化的人才来实施、维护和扩大必要的计算基础设施。仅在实施阶段的投入就是2023年AI支出中最大的一块,有时甚至是全部预算中的最大部分。一位高管提到,“利用LLMs的成本可能只是构建应用场景成本的四分之一”,开发成本占据了大头。
为了帮助企业快速启动和运行他们的模型,基础模型提供商提供了并仍在提供专业服务,通常涉及到定制模型开发。我们估计,这在2023年为这些公司带来了相当一部分收入,并且选择特定模型提供商的关键原因之一就是他们提供的性能。由于在企业内获得合适的生成式AI人才非常困难,因此,那些提供工具以便企业更容易将生成式AI开发引入内部的初创公司可能会看到更快的采用率。
生成式AI不仅仅是技术进步的象征,它正在成为推动企业创新、提高效率和节省成本的关键工具。随着企业对生成式AI投入的增加,我们可以预见一个更加智能、高效和互联的商业世界。
# 模型趋势:朝向多元化和开源的未来
## **多模型未来已来临。**
仅仅半年前,大多数企业还在试验单一模型(通常是OpenAI的)或最多两个。但当我们今天与这些企业领导对话时,他们都在测试——甚至在某些情况下已经在生产中使用——多个模型。这样做使他们能够1)根据性能、规模和成本为不同的应用场景量身定制模型,2)避免对单一供应商的依赖,以及3)快速利用这个快速发展领域的最新进展。这第三点对于领导者来说尤其重要,因为模型的领先地位不断变化,公司们渴望整合当前和未来的最先进模型及开源模型,以实现最佳效果。
我们很可能会看到更多模型的出现。在下面的图表中,根据调查数据,企业领导者报告了在测试中的模型数量,这预示着将用于推动工作负载到生产的模型。对于生产用例,OpenAI依然占据主导地位,这是预料之中的。
## **开源模型的兴起。**
过去六个月中最令人意外的变化之一就是对开源模型的偏好显著增长。我们估计,2023年市场上80%-90%的模型是闭源的,其中大部分份额归于OpenAI。**然而,46%的调查参与者表示他们偏好或强烈偏好转向2024年的开源模型。**在采访中,近60%的AI领袖表示他们对增加开源模型的使用或在细调后性能相近的开源模型上进行切换感兴趣。因此,从2024年开始,企业对开源的使用预期发生显著转变,其中一些明确表示目标是实现闭源和开源之间50/50的使用比例,这是从2023年80%闭源/20%开源的分配中显著上升的。
## 虽然成本是考虑因素,但控制和定制性是选择开源的主要原因。
选择开源的主要原因远远超过了成本考虑,控制(数据的安全性和模型输出的可解释性)和定制性(针对特定应用场景有效细调的能力)是企业采用开源模型的首要原因。这反映了企业领袖们的共识,即生成式AI创造的价值远远超过其成本。如一位高管所言:“获取准确答案的价值远胜于其成本。”
## 对控制的需求源于对敏感应用场景和企业数据安全的关注。
企业对于与闭源模型提供商共享其专有数据持保守态度,这一点并不让人意外。特别是对于那些将知识产权视为业务核心的公司来说,他们对数据隐私和安全性的要求尤其严格。虽然一些企业选择自行托管开源模型来解决这一问题,但还有其他企业更倾向于选择那些能够提供虚拟私有云(VPC)集成的模型,以保证数据安全和合规性。
## 企业通常通过微调而非从头开始构建模型来进行定制。
尽管之前有关于如同BloombergGPT这样的自定义模型的讨论,但随着高质量开源模型的出现,大多数企业现在倾向于不从头开始训练自己的LLM,而是选择通过检索增强生成(RAG)技术或对开源模型进行微调以满足其特定需求。
## 云服务在模型采购决策中仍然扮演重要角色。
许多企业选择通过他们现有的云服务提供商购买模型,这主要是出于安全考虑——他们更担心闭源模型处理数据的方式,而不是他们的云服务提供商——以及为了避免复杂的采购流程。在2024年,这种趋势仍在持续,意味着企业倾向于选择与其现有云服务提供商合作的模型提供商。例如,Azure用户倾向于选择OpenAI,而Amazon用户则更倾向于Anthropic或Cohere。
## 客户对早期市场的特性表示关注。
尽管企业在选择模型时,更看重模型的推理能力、可靠性和易于接入(例如,通过他们的云服务提供商),但他们也对具有差异化特性的模型表示出了兴趣。例如,一些企业因Anthropic先前200K的上下文窗口特性而选择它,而其他企业则因Cohere在微调方面的早期市场优势而倾向于使用它。
## 大部分企业认为模型性能正在趋于一致。
虽然技术界关注于将模型性能与公共基准进行比较,但企业领导者更加关注于将微调过的开源模型和闭源模型的性能与他们自己的内部基准进行比较。有趣的是,即便闭源模型在外部基准测试中通常表现更好,企业领导者仍然给予开源模型较高的NPS评分,因为它们更易于针对特定用例进行微调。这表明,按照这些标准,模型性能的差异正在快速缩小,为企业领导提供了从中选择的更广泛且能力强大的模型范围。
## 提升灵活性与自主性。
企业正将他们的应用设计得更加灵活,以便能够轻松地在不同的模型间切换,仅需修改API即可。这种做法背后的思路是,借鉴了云服务时代的教训,减少对单一供应商的依赖,并应对市场快速变化的现实。一些企业甚至在部署前对各种提示进行预测试,确保能够随时无缝切换,而“模型花园”的概念也应运而生,使得根据不同应用需求部署特定模型成为可能。
# 应用案例:向生产迁移
## 企业偏向于内部开发而非外部采购。
目前,企业更加倾向于自主开发AI应用,而不是购买市场上现成的产品。这主要是因为市场上缺乏能够满足所有企业特定需求的、经过严格测试的AI解决方案。基础模型及其API的普及,使得企业能够更容易地按照自己的需求定制开发AI应用,无论是改进客户服务、内部沟通,还是探索新的应用场景如产品配方设计、科学研究和销售策略优化。市场上许多仅仅是基于LLM简单封装的产品,因为缺乏创新而难以满足企业的复杂需求。
尽管如此,随着更多专注于企业需求的AI应用问世,未来的格局可能会发生变化。一些领导者对于能够使用市场上“最优秀的工具”持开放态度,认为生成式AI作为一种“战略性工具”,能够使企业减少对外部服务的依赖,增强自身的竞争力。因此,那些能够突破传统界限、帮助企业优化工作流程和更好地利用专有数据的创新应用,将在市场上脱颖而出。
通过这种方式意译,我们不仅保留了原文的核心信息,还努力使内容更贴近中文读者的阅读习惯和文化背景,同时尽量简化专业术语,让信息更易于理解。
## 企业对于内部应用案例充满热情,但对外部应用则持更加审慎的态度。
这种谨慎的态度主要源于对生成式AI(genAI)的两大担忧:一是AI生成内容的准确性和安全问题,二是在部署生成式AI时可能引发的公关危机,尤其是在诸如医疗保健和金融服务这样的敏感消费者领域。去年,最流行的应用案例集中于提升内部效率或在触及客户之前需经过人工审核的环节,例如编码助手、客户支持和市场营销。如下图所示,2024年,这些案例在企业中依然占据主导地位,企业更倾向于将文本摘要和知识管理(例如内部聊天机器人)这样的完全内部使用案例推向生产,远超过那些需要敏感的人工审核(如合同审查),或是面向客户的应用案例(如外部聊天机器人或推荐算法)。企业急于避开生成式AI导致的失误,比如加拿大航空在客户服务上的失败案例就是一个警示。由于这些担忧对大多数企业而言依旧重要,因此,那些开发出能够帮助控制这些问题工具的初创公司可能会见证其产品的显著增长。
# 机遇的整体规模既庞大又在迅速扩张。
## 我们预计,到2024年底,模型API和精细调整方面的总支出将超过50亿美元,企业支出将成为这一机遇的重要组成部分。
根据我们的估算,模型API(包括精细调整)市场在2023年底的收入约为15亿至20亿美元,其中包括通过Azure对OpenAI模型的支出。鉴于市场整体预期的增长和企业具体的积极反馈,仅这一领域的支出到年底就将增长至少到50亿美元,潜力巨大。正如我们所讨论的,企业不仅将生成式AI的部署放在了优先位置,还增加了预算,并将这些预算重新分配给了标准软件产品线,优化了跨多个模型的使用案例,并计划在2024年把更多工作负载推向实际应用,这意味着他们极有可能成为推动这一增长的主力军。
在过去六个月里,企业已经从上到下发起了寻找和部署生成式AI解决方案的倡议。之前需要超过一年时间才能完成的交易,现在能在两到三个月内快速完成,而且这些交易的规模远超过以往。虽然本文主要关注于基础模型层面,我们还相信,企业中的这一机会将扩展到技术堆栈的其他环节——从辅助精细调整的工具,到模型部署,应用构建,乃至于专门针对AI设计的原生应用开发。我们正处于企业采用生成式AI技术的一个关键时刻,对于能与这个充满活力且持续增长的市场中的新一代公司合作感到兴奋不已。
# 知识库动态
# Top 100 生成式AI消费(ToC)类应用 | 猎人翻译
> 来源:[https://aigcreative.feishu.cn/docx/KhzjdQmANoQq7ixO2DicBnc6nRh](https://aigcreative.feishu.cn/docx/KhzjdQmANoQq7ixO2DicBnc6nRh)
> 原文链接:https://a16z.com/100-gen-ai-apps/
> 翻译:创意猎人-Kevin
一年多前,ChatGPT将生成式人工智能引入公众视野,我们已经见证了成千上万个新的消费产品,融入了AI——从视频生成器到工作流程工具,从创意工具到虚拟伴侣。
六个月前,我们深入挖掘了网络流量数据,根据每月访问量对最受欢迎的生成式AI网络产品进行了排名,并揭示了消费者实际上如何使用这项技术的模式。
尽管一些早期“赢家”吸引了广泛的关注,特别是ChatGPT和Midjourney,但每个月都有新的AI原生公司涌现,推动了一个充满活力的竞争市场。
现在,六个月后,我们重新回顾了数据,更新了我们的分析,再次根据Sim**ilarWeb(截至2024年1月**)排名了前50个AI优先的网络产品。结果表明:与我们于2023年9月的初始报告相比,名单上有超过40%的公司是新出现的。
然而,与我们最初的分析方法不同——那次分析中,我们首先根据网络流量对公司进行排名,然后再为那些公司添加了移动应用程序数据——这次我们将网络和移动Gen AI产品分为两个单独的列表。
类似于网络排名,移动应用程序根据每月活跃用户数排序,根据Sensor Tower数据(截至2024年1月)。这种区分使我们能够首次全面研究顶级AI移动应用的全部领域。消费者在网络和移动设备上与Gen AI互动的方式存在明显差异,我们将在下文中详细讨论。
# 发展迅猛:6个月内新增22家公司
然而,除了这些排名本身的吸引力外,数据还揭示了一些关于新兴和扩大的类别、AI投资以及参与模式的显著趋势。以下是我们的一些重要观点:
考虑到ChatGPT令人印象深刻的早期增长——在我们六个月前的分析中,它已经是世界上访问量排名第24的网站——我们预计这一开创性的聊天机器人将保持在榜单顶部的地位。事实上,ChatGPT每月接近20亿次网络访问量,大约是排名第二的公司(Gemini)的五倍左右。
除了Gemini、伴侣创建者Character.AI和写作助手Quillbot之外,排名前五的位置保持不变。然而,并不是说过去六个月榜单一成不变:有22家公司是新进入网站流量排名榜单的。
在所谓的新来者中,排名最高的包括AI研究协作工具Liner、Anthropic的通用助手Claude,以及三款未经审查的AI伴侣应用程序:JanitorAI、Spicychat和CrushOn。
在这个列表中,ChatGPT依然位居榜首,不过领先优势明显缩小了。以月活跃用户计算,ChatGPT的规模大约是第二和第三名微软Edge和Photomath的2.5倍。在移动产品方面,前五名的排名由微软的搜索引擎Bing和照片增强器以及头像创建者Remini组成。
有趣的是,有五家AI公司真正地“跨界”,在前50名榜单上同时有一个网络产品和一个移动应用程序:ChatGPT、Character.AI、聊天机器人聚合器Poe,以及图像编辑器Photoroom和Pixelcut。
# 新兴品类持续涌现:音乐、生产力工具
在六个月前的分析中,我们注意到像ChatGPT这样的通用LLM助手占据了大部分的网络流量。而在我们最新的分析中,我们看到两个新的类别加入了这个混合中:音乐和生产力(包括研究、编码辅助和文档摘要等任务)。
目前为止,Suno是唯一进入排名的音乐公司。该工具可以根据文本提示在浏览器中生成原创歌曲,包括歌词,并提供各种风格选择。Suno最初仅限于Discord,类似于Midjourney,但在2023年12月推出了独立站点和Copilot扩展。
一些现在主要的消费者AI产品,像Suno一样,最初是在Discord服务器上开始的,或者仍然主要通过Discord运行。这个平台提供了一个测试场地以及社区,而不需要进行完整的前端产品构建。真正的Discord服务器流量几乎不可能测量,但每个服务器邀请页面的网络流量是一个近似指标。根据这一指标,截至2024年1月,有九个AI产品或社区在按邀请流量排名的前100个Discord服务器中,其中Midjourney排名第一。
在列表中,另一个显著的新类别是生产力。AI原生平台可以提升用户与软件的互动,使他们能够委派琐事并减少在行政工作上的时间。生产力类别包括七家公司:Liner、Eightify、Phind、MaxAI、Blackbox AI、Otter.ai和ChatPDF。
这些公司致力于帮助员工、自由职业者和中小型企业主更高效地完成任务,他们的特点包括流程中的编辑和摘要功能。例如,Eightify提供YouTube视频的摘要,而Otter.ai则实时记录会议笔记并转录。
在这个列表中的七个生产力应用中,有六个提供或完全通过Google Chrome扩展程序运行。我们预计更多的AI生产力工具将“融入工作流”中,与用户已经在进行的工作紧密结合,从而消除了在工作空间和诸如ChatGPT之类的助手之间复制和粘贴提示和输出的需要。
另外,AI生产力公司可能会发明围绕通用AI的独特功能构建的全新端到端工作流程。AI工作流产品可以帮助用户识别可以改进的内容,然后自动进行这些改进。
# **AI陪伴类APP迎来了增长高潮**
拥有AI伴侣可能看起来很小众,但这已成为生成式AI的主要用例之一。已有数百万人——包括我们自己——与聊天机器人建立了关系。
从网络和移动数据信号中可以看出,AI伴侣已成为主流。在我们的网站伴侣产品中,有六款产品自称为“无审查”,用户可以与它们进行在ChatGPT进行对话或互动。
用户主要通过移动网络访问这些产品,而不是桌面端——虽然几乎没有一个产品提供应用程序,但在我们的网站列表上,无审查伴侣工具的流量平均有75%来自移动端。
对于拥有移动应用的伴侣产品,用户参与度异常高。
根据SensorTower的数据,每个用户平均每月与Character.AI互动298次,而与Poly.AI的互动平均为74次。
我们已经开始观察到更为广泛的伴侣应用的早期迹象,不仅局限于AI“男友”和“女友”,还包括友谊、指导、娱乐,甚至最终是医疗保健。最近一项《自然》研究表明,Replika聊天机器人减少了3%的用户自杀念头。
# **移动端VS网页端之间的差异**
在移动应用和网络应用中,AI的使用场景存在显著的差异。
一般而言,网页(PC)应用更适合支持复杂、多步骤的工作流产品,主要围绕内容生成和编辑展开。这些产品包括ElevenLabs的AI语音工具包、Leonardo的AI艺术生成器以及Gamma的AI演示文稿构建器等,这些产品均在基于网页(PC)的新一代 AI 产品中排名前 20。
与此同时,移动应用的使用趋向于通用助手,其中许多模仿了ChatGPT。当浏览排名前列的移动应用列表时,可能会注意到有10家公司的名称与ChatGPT非常相似。部分原因是因为ChatGPT相对较慢地推出了自己的应用程序,为模仿者提供了快速获得App Store优化优势的机会,尤其是进行付费广告推广。
一些模仿ChatGPT的移动应用被称为“绒毛软件”。它们通过类似标题和标志的方式欺骗用户,让用户误以为它们提供了访问ChatGPT的高级模型的途径,但实际上,它们收费提供的是ChatGPT上免费提供的相同模型的访问。这些应用经常更改它们的名称或描述,使得应用商店难以“监管”这种行为。
其他受欢迎的生成式AI移动应用类别则专门针对手机的独特功能进行了定制。在应用列表中有七款专用的头像产品;大多数人手机中保存的自拍照可以作为可用的训练数据。此外,排名前三的应用中,Facemoji(排名第9位)、Bobble(排名第31位)和Genie(排名第37位)都是专为移动设备设计的键盘应用,允许用户在发送文本时得到AI的帮助。
教育科技是移动应用中受欢迎的另一个类别,用户可以通过手机扫描作业问题(如Photomath),或者通过实时对话学习语言(如Elsa)。值得注意的是,尽管大多数排名靠前的生成式AI移动应用是自给自足的,即没有融资,但根据PitchBook的数据,七款排名靠前的教育科技应用中有四款已经筹集了超过3000万美元的资金。
# AI应用在全球性涌现,没有一家独大
尽管硅谷是人工智能的中心,但全球各地都涌现出备受欢迎的产品,尤其是在移动应用领域。虽然我们列表中超过30%的生成式AI网络产品源自旧金山湾区,但该地区仅占12%的移动应用开发者。同样地,超过一半的顶级生成式AI网络产品是在美国开发的,但仅有不到三分之一的移动应用来自美国。
移动应用开发者取得了多项成功。例如,总部位于伊斯坦布尔的应用工作室Codeway开发了一系列生成式AI移动应用,包括AI照片动画应用Face Dance、聊天机器人应用Chat & Ask AI以及AI艺术生成器Wonder,这些应用都在移动应用排行榜上名列前茅。另一家总部也位于土耳其的公司HubX开发了Nova聊天机器人、达芬奇艺术生成器和PhotoApp增强器。
这些应用工作室通常能够从跨产品的共享专业知识中受益,了解如何推出、吸引流量和盈利应用。一些公司专注于高效地产生收入,而另一些则追求风投路径。位于米兰的科技公司Bending Spoons是这样的一家公司,他们开发了视频编辑器Splice和照片增强器Remini,名列移动应用榜单前五,并最近宣布了一笔1.55亿美元的股权融资。
很明显,新一代的AI原生产品及公司正在比以往都更快地增长并更深地吸引用户。我们相信,在未来十年中,人工智能将成为定义行业标准的重要驱动力。
# 知识库动态
# ProductHunt 2023 年度最佳产品榜单 | 猎人翻译
> 来源:[https://aigcreative.feishu.cn/docx/A3EddfSBBoqIAIxJ6fTcEr4dnfh](https://aigcreative.feishu.cn/docx/A3EddfSBBoqIAIxJ6fTcEr4dnfh)
> 原文链接:https://www.producthunt.com/golden-kitty-awards/hall-of-fame?year=2023#ai-model,
> 翻译:创意猎人-Kevin
# 年度产品
你以为 2022 年是 OpenAI 的一年。然后到了 2023 年,这一年人工智能创新的步伐将加速。
ChatGPT 已经开始在年轻一代的浏览器书签中巩固自己的地位,并即将成为一个家喻户晓的名字,甚至连您最不懂技术的亲戚也认识到这一点。
然后,谷歌希望获得对其悄悄研究的所有人工智能进展的认可,推出了 Bard,它的 ChatGPT 竞争对手,由该公司自己的“it”模型 Gemini 提供支持。但仅仅一个多月后,OpenAI 就凭借 GPT-4 重新赢得了人们的关注。
新模型接受了最新数据的训练,比其前身更好地理解上下文,并且可以处理复杂的指令。它可以参加律师资格考试,并在考生中排名前 10%(GPT-3.5 得分排名后 10%)。
凭借 GPT-4(以及今年晚些时候添加的 DALL-E 3),ChatGPT 在 2023 年结束之前每周用户数量就突破了 1 亿。此外,今年有数千种使用 GPT-4 和 GPT-4 Turbo 构建的产品和机器人,其中包括其他一些 2023 年度产品提名产品。
这些被提名者创造了我们在 2023 年看到的一些最佳生产力功能和最有用的生成式 AI 应用,从 Arc Browser 的 AI 文件重命名到 Notion 的 AI 数据库自动填充。
也许 2024 年 OpenAI 将为另一个竞争对手腾出领奖台,但 Sam Altman 已经证明他不会让步。
# 开发者工具
我们经常说工具是开发人员最好的朋友,在 2023 年也不例外。在以大规模技术创新为标志的一年中,软件工程行业通过将人工智能等技术融入其工具中来实现代码审查和调试过程等自动化。所有这些都是为了让开发人员的生活变得更轻松。
像 Github 这样的大公司也加入了 Copilot X 的行列。较小的团队也有自己的发言权,比如今年的亚军之一:Warp。
2023 年延续前几年的两个工程主题包括让 API 变得更简单,以及创建有助于缩短开发人员与其他团队(通常是营销团队,如果我们诚实的话)之间存在差距的工具。 Resend 存在于这两种持续趋势的交叉点:开发人员可以大规模构建、测试和发送交易电子邮件的工具。
# 设计工具
对于设计工具来说,今年是过山车般的一年。与许多同行一样,设计工具公司必须适应随着人工智能兴起而快速变化的行业。再加上注定失败的 Adobe-Figma 收购,感觉这个行业总是成为新闻焦点。
去年推出了大量设计工具,但其中一些比其他工具更引人注目。专注于协作、人工智能集成和动画的公司因其创新而受到社区的奖励。
今年的提名反映了这一点。 Jitter 是获胜者,它让动画变得大众化,而 Framer AI 则让您可以在几分钟内启动登陆页面。
# 无代码
既然生成式人工智能已经出现,无代码类别的未来是什么?这就是决赛入围者现在向我们提出的问题,即简单的英语可以立即生成整个网站。
该类别的获胜者还独特地提醒我们,仅仅因为某些东西很快并不意味着它就一定是脏的。 Bento 重新构想了个人网站和个人简介页面,使其成为互联网上丰富、美丽且功能良好的地方。
“这比我们在其他 link-in-bio 工具中看到的四四方方的按钮和扁平网格要好得多。” Product Hunt 社区在将 Bento 推升至 2023 年投票数最高的产品中排名第七时这样想。Linktree 同意了,后来它收购了 Bento在这一年里。
# 数据与数据安全
在过去的几年里,数据和数据安全领域的特点是制造商试图让数据对每个人来说都更容易、更灵活,而不仅仅是数据分析师和网络安全专家。
今年最佳数据工具的获奖者 Equals 于 2022 年首次推出,从重塑电子表格开始。继 1600 万美元的 A 轮融资后,Equals 在 2023 年不断推出新功能和改进,使电子表格功能更加强大。其中包括添加的人工智能功能,当然还有仪表板的推出,它提供了一种将电子表格立即转换为由实时数据驱动的仪表板的方法。
# 开源
根据 Github 的 Octoverse 报告,2023 年首次开源贡献者的数量最多。开源牵动着世界各地创客的心弦。这是一个以协作和社区驱动为荣的行业。
开源无处不在。无论您是否知道,它都已融入我们的生活方式。从框架和数据库到开发工具 (Novu),再到世界上一些最流行的人工智能模型 (Stable Diffusion),一切都依赖开源贡献者来保持交付。
# 人工智能产品
今年最佳人工智能产品类别的决赛入围者展示了生成式人工智能在理解复杂提示方面的进展,从使用 3D 动画 (Dora AI) 生成整个网站到使用简单英语的高质量视频 (Pika)。
与去年一样,谷歌和微软等大型科技公司将与创新新秀争夺这一头衔。随着对 AI 模型、AI 基础设施和 AI 平台的访问范围不断扩大(例如 OpenAI 的 GPT 应用商店),我们预计会看到更多不同的创客在这个领域创造出下一个重大产品。
# 人工智能特点
是否感觉您的堆栈中的每个产品都将在 2023 年进行人工智能改造?这不仅仅是巴德-迈因霍夫现象。我们看到很多我们最喜欢的产品都迭代了新的人工智能功能,因此我们今年不得不创建一个全新的奖项类别。
制造商交付这些产品的速度有多快,以及团队如何在人工智能的帮助下,重新构思新的解决方案来解决他们最初要解决的问题,这给我们带来了启发。事实上,许多制造商告诉我们一些版本的“我们一直想这样做,但技术终于赶上了。”
该类别的提名者因将人工智能流畅地融入其产品而受到认可。他们在我们需要的时候准确地生成我们需要的内容,完成过去需要几个小时的繁重工作,凭空开发人造角色,并一路上真正让我们感到高兴。
# 人工智能模型
OpenAI 今年为我们提供了两个最好的人工智能模型,并将它们打包到一个出色的聊天机器人中。这很难被击败。
不过,不要只见树木,不见森林。大型语言模型全面进步,为我们提供了大多数人一年前无法想象的生成式人工智能能力。我们可以从一些文本生成整个网站、演示文稿和头像。我们可以创造出任何我们想象的图像——如果我们愿意的话,还可以“让它变得更多”。
[明年这个类别](https://www.producthunt.com/newsletters/archive/26889-a-controller-for-your-phone)将会有[什么?更具生](https://www.producthunt.com/products/meta#audiocraft)成性的人工智能? “大型行动[模型”? 生成](https://deeperlearning.beehiiv.com/)口语模型?通用人工智能? (Pst:跟随并找出答案。)
# 人工智能基础设施
随着越来越多的人工智能模型和产品的出现,帮助构建、改进和监控它们的工具比以往任何时候都更加重要,因此金猫奖中出现了一个新的类别。
该类别的决赛入围者帮助 AI 制造商为其产品选择正确的 AI API 并在它们之间进行切换 (EdenAI),快速创建和部署 LLM 插件 (Langdoc) 或 LLM 应用程序 (LLM Spark),以及跟踪和调试复杂的 LLM 应用程序 (Langfuse) )。
# 金融科技
当你想到金融时你会想到什么?即使在今天,仍有不少人会想起华尔街办公室里股票经纪人疯狂买卖股票的景象。谢谢,华尔街之狼。
虽然金融可能很乏味,但一个好的金融科技工具可以让这个领域变得迷人甚至有趣。今年类别的决赛入围者涉及从启动资金到个人理财的所有内容。这些工具有助于缓解企业和个人在处理银行、投资或融资时的焦虑。
# 移动应用
根据 data.ai 的数据,移动用户平均每天花在手机上的时间为 5 小时。我们如何度过这段时间以及我们使用的应用程序都是个人的。有些人可能会在他们最喜欢的锻炼应用程序上出汗,而另一些人可能会使用他们最喜欢的生产力工具来安排一周的时间。 5 分钟后,新的应用程序再次改变了一切。
如今,有了“适用于一切的应用程序”并适合各种个性,很难从人群中脱颖而出,但该类别的决赛入围者正是那些正在这样做的人。
最佳移动应用获奖者 Hevy 最初由独立开发者于 2019 年推出,他们希望建立一种更好的方式来记录他们的锻炼情况,并在此过程中提供更好的社交体验。该应用程序已在全球拥有 150 万健身运动员。 Hevy 在网络上的文章中被评为顶级训练应用程序,在 App Store 和 Google Play Store 上获得 4.9 的评分,总共有 71,000 条评论。
# Web3 和加密货币
看起来 web3 在 2021 年迎来了最辉煌的时刻。硬币每天都在下跌,社区如雨后春笋般涌现,当然,NFT 是每个人脑海中的热门话题。快进到 2022 年,炒作已经平息。
尽管今年 web3 可能还生活在 AI 的阴影下,但许多信号表明该行业正在等待下一个时刻。比特币在 2023 年回升了 155%,达到 4.5 万美元,是 2022 年以来的最高水平。在 Product Hunt 上,区块链 (-25%)、加密货币 (-18%) 和 NFT (-30%) 等类别的发布量有所下降,但选民对那些脱颖而出的产品表示乐观。 2023 年获得最多支持的 15 个产品中有 4 个与 web3 相关。
web3 背后的社区为 Clustr、eesee、Anytype 和 Galaxe 等产品提供了支持,这些产品去年都跻身最受欢迎的 25 个产品之列,在 Product Hunt 排行榜上留下了自己的印记。技术人员推测,“加密货币冬天”可能会清除这个空间,只留下最好的产品——我们将把目光投向决赛入围者作为顶级竞争者。
# 个人生产力
生产力是 Product Hunt 上第二热门的话题,仅 2024 年 1 月生产力产品就有近 37,000 票。
人们很难不喜欢那些可以帮助您更高效地做事的工具,这样您就可以将时间花在重要的事情上。该类别的决赛入围者解决了从浏览器到日历等日常生活各个领域的生产力问题。
今年的获胜者 Heptabase 是一款笔记工具,可帮助您通过工作空间的可视化组织来学习复杂的主题。作为粉丝喜爱的 Notion 和 Obsidian 的替代品,该工具越来越受欢迎。
# 团队生产力
在团队动态的世界中,生产力不仅仅是一个流行词,它是成功协作的基石。据 Statista 称,到 2024 年,生产力软件的收入预计将达到 790 亿美元。基于工作的解决方案将占其中很大一部分。
这些工具对于将个人努力转化为统一力量至关重要。他们擅长编排复杂的项目,将每项任务变成一个协调良好的整体的一部分。这是为了打造一个让创造力蓬勃发展的空间,并通过集体的动力和精确度来实现目标。
今年的获胜者是 FuseBase。可以将其想象为与 Notion 类似,但更适合专业服务。它将项目管理、知识管理和客户协作合而为一,这样您就不必在试图完成工作的应用程序之间切换。
# 市场销售
今年最佳营销和销售工具的优胜者和亚军就像许多身兼数职的营销人员的职位描述一样多种多样。但如果说每个现代收入驱动者都学会优先考虑一顶帽子的话,那就是内容创造者。
我们看到的许多最具吸引力的营销工具都是那些能够使最困难、最耗时的内容变得更容易的工具,无论是电子邮件还是支持文档。随着数字化参与度达到顶峰,团队必须尽最大努力跨多个社交平台 (STORI AI) 接触客户,在收件箱中吸引注意力 (Loops),在几秒钟内向客户介绍产品 (Floik),并为他们提供支持他们喜欢的体验 (D-ID)。
这些工具可以帮助热爱内容的专业人士取得突破。
# 社区与社交
不管喜欢还是讨厌,我们在 2022 年都在等待 Elon's X(以前的 Twitter)的可行竞争对手取得突破。 Moonshot 初创公司瞄准了 X,但尚未达到吸引足够多的 X 500 多百万用户的临界点。
因此,社交和科技领域的大腕们又重新回到了擂台上。扎克伯格和 Meta 推出了 Threads,尽管有人反对,但该社交网络在年底在欧洲推出后,已显示出拥有 160 名用户的持久力,并在 App Store 中名列前茅。与此同时,Jack Dorsey 构思并支持了 Bluesky,这是一款大肆宣传的去中心化社交应用程序,在测试阶段很快就拥有了 200 万用户。
与此同时,随着 API 的变化和用户从一个工具跳到另一个工具,这个领域的制造商一直在应对快速变化的社会环境的压力。入围或提名的社交工具构建了我们所见过的最有用、适应性最强的社交技术。
# 自己和小团队
“快速行动,打破常规”最初是马克·扎克伯格创造的 Facebook 内部座右铭。对于拥有小团队的初创公司和那些选择自力更生路线的初创公司来说,这句话已经焕发了新的活力。
自力更生唤起了一种特定类型的浪漫主义,但它也给资源匮乏的创始人带来了挑战。放弃投资,选择靠自己改变世界的想法是一个强大的想法,驱使许多制造商继续前进。这也是一种在科技界影响力越来越大的趋势。
这一类别的创客展示了令人印象深刻的足智多谋、创造力和毅力的能力。他们通过小团队、自力更生或两者兼而有之,创造了一流的产品。从无代码 (Tally 2.0) 到人工智能 (Impakt AI),这些技术在 2023 年的表现远远超出了它们的实力。
# 年度创客
每年,世界各地的制造商都会冒着风险,一头扎进打造他们梦想的产品。有时,这是一个有趣的副业项目。其他时候,这家公司正走在成为独角兽的快车道上。
其中一个共同点是,成为一名创客需要激情、奉献精神和勇气,而每一项都让 Product Hunt 变得更好。这就是为什么我们设立年度创客奖,以纪念那些走出去改变世界的人们。今年的获胜者是马克·卢。
Marc 在 2023 年推出了多达 14 种产品,涉及多个不同的领域。从保护您免受条纹纠纷的工具到以可爱为核心的习惯养成平台。马克真正表达了他的想法。
# 年度社区成员
你知道PB&J吗?当然可以。典型的盒装学校午餐,一种标志性的三明治,其作用不仅仅是各个部分的总和。两种成分完美匹配,当你缺少一种时,它就变得不一样了。
Product Hunt 也是如此。创客和社区齐头并进。 Product Hunt 社区为人们创造了一个向世界展示其作品的诱人空间,在每次发布中,您都会看到社区成员祝贺创始人、提供反馈和提出问题。在发布之外,社区成员会分享他们的经验并在讨论中寻求建议。在颁发此奖项时,我们寻找的是真正有效参与的社区成员,而不是依靠人工智能来快速管理关系建立。
今年的年度社区成员是 Elly Cho。 Elly 是 Slash Page 的首席运营官兼联合创始人。当 Elly 不推出 Product Hunt 时,她会通过提供批评性反馈、参与讨论以及为更广泛的社区发出宝贵的声音来帮助其他创客。
# 知识库动态
# 思考:AI上国内团队好像被甩开了?差钱?差人?
> 来源:[https://aigcreative.feishu.cn/docx/Mexpdbb5koOCjrxhuANcCqFanOe](https://aigcreative.feishu.cn/docx/Mexpdbb5koOCjrxhuANcCqFanOe)
> 来源:公众号:琢磨事
> 作者:老李话一三
> 链接:https://mp.weixin.qq.com/s/6juT2Dlq8ZEFn8WrgNgYiA
当我们还在困扰为什么国内大模型没有GPT4好用的时候,Sora来了。这潜在意味着从AGI视角看,追赶一年后差距似乎并没有缩小反倒是被拉大了。
勾连过往,这个问题就不太简单了,可以从好多维度展开:
我们是不是可以说AI国内国外团队一度站在类似平齐的起跑线上?
为什么从AlphaGo开始似乎看不到国内团队的原创,而是持续在追赶?
为什么在追赶的时候,距离似乎在被放大?
## **一点点回溯**
如果回到语音识别、人脸识别,应该可以讲大家处在类似平齐的起跑线上的。甚至因为场景和数据丰富在这两项上国内团队还占优。一个佐证是过去很多的比赛成绩;另一个是佐证是应用范围。老外到现在也不怎么用人脸,所以真实场景下人脸识别的精度,很可能还是国内团队的算法占优。
自动驾驶是个奇妙的领域,做了十几年花了几千亿,但似乎都卡在某个限度下面了。所以也看不出什么区别。
所以说**如果回到2010年之后的十年,说**大家在基本平齐的起跑线上,大致是不错的。当时大家比较公认的是AI上没有秘密,毕竟一有进展论文立刻就出来。
问题出在大模型上。
在大模型上,局面变成了:
**在平齐的起跑线上,OpenAI率先做出来大模型后**,别的团队在追赶的同时,差距还被拉大了。
如果单纯的拿没做出来说事似乎也是偏颇的,毕竟Google也没做出来。
但如果横向展开些就发现也不是那么偏颇,在AI这个领域里我们好像并没有做出太杰出的贡献。AlphaGo,chatGPT,甚至智能音箱、自动驾驶等似乎都是在重复过去C2C的故事。追到平齐的起跑线上却重复过去的故事,这不能说不是问题。
**互**联网这样是正常的,毕竟你缺了过去几十年在IT上的积累,按切入的时间点(2000年前后),你就只能这样,但AI还这样,就是问题了。
追着不顺利的时候,大家就比较多反省人才密度、资金、机器等。
但其实根本不是主因,调度起这些资源对于小公司是很难的,但还是很多公司有这个实力。(如果统计2022年发布chatGPT之前的融资金额你会发现还是不少公司融资比OpenAI多)
再进一步深层反省是需要勇气的,因为会打破一些人类本性中无谓的自尊心。
有点像一个人正兴高采烈自信的很,你非上去说,他还有那些地方不行,他真的很容易揍你。
如果不正视这种差距,并挖掘差距的根本,那再过十年,老套的故事就会再来一遍:
**好像差不多了基本平齐,然后被甩开差距,然后追赶,**然后反省表面因素。一遍一遍循环这个过程。
可怕的点在于:一个是循环自身的周期本来就不短,整体循环的所占的时间就更长。
最终后果是不是灾难性依赖于领域本身的基础特质。
对于天花板比较明显的领域,到达某个限度后,大家其实差不多,所以影响不是特别大。相当于领跑的停了,那后面的只要足够坚持就能赶个七七八八。
**对**于没有天花板,活性极强,并且今天的结果会是明天的的最大推动力的领域,那么后果很可能是灾难性。这会导致越跑距离越大,并且是在指数曲线上的距离。
很不幸,人工智能看起来是这样的领域。
## **为什么呢?**
不知道谁发明了个词叫人才密度。
然后似乎原因被找到了:人不行。
在付会上钱不够,机器买不着,似乎原因就非常明显,还特别好理解,也容易引起共鸣。
实际上这种认知视角本身就是问题。
背后体现一种思维模式的缺陷。
对于组织而言,不能像过去那样只关注:人财物等有形要素,还要关注场。
场是价值观、文化、制度、信念的综合。
我们不能忽视的一个基本事实是:
到一定程度后,其实人个体智商是差不多的。所以人才密度是趋同的。
AI就是这情况。
真做AI的人,差不多都是从顶级学校里又选了一拨人,非说谁比谁有绝对差距,那就真不是这样。
钱的话OpenAI过去用的钱虽然不少,但很多团队用的钱并不比他们少,2022年之前一共差不多融了30亿美金。(比如:商汤融的其实比这多)
核心的问题恰恰不是这些可见要素,而是场的差别。
简单说**你用修长城的场,不管给多少人、多少机器、多少钱该干不**出来还是干不出来,该撵不上就还是撵不上。
(还可以类比皮克斯做动画,动画做不好也是人才密度、机器、钱不行么?)
场可以看成独立生命体,并且在大时空尺度下持续存在,特征也会变化。
如果我们总是干存量修长城的活,场的作用是小的,按图纸搬砖,加大检查,谁干的好就多给钱,干不好就批一顿或者开掉,大致是可以的。
但**大模型这种领域显然不是这么个特征,之前有人做过内部模块拆解,其**组成还是非常复杂,需要团队一起摸索开拓。
这时候**场的落后就是致命的**。
**你**拿黑社会的场去干大模型,对于已经做出的部分,基于开源,已有论文追一追是可以的,但在乌漆嘛黑的未来里探索出一条路,并持续领先就没可能。
这是真的问题。
## **组织的间断平衡论**
这可以再形象一点来看这问题。
团队的类型可以是外科手术型的,一切以主刀医生为中心,别的全是打下手的。(其实修长城本质是这个)。
也可以是足球型的。大家有个角色,但需要更灵活的补位和配合。
更灵活的是网球团队。大家没有角色灵活补位。
**对于大模型开发而言,外科手术的肯定**是不行的,至少需要优秀的足球模式的团队。
只有模式也还不够,同样是足球队也还有我国足球的情况。
模式还要配合上文化等进行综合才是合适的场。
**最终就形成场的先进性:活性且有力量。(可以拿终结者**的液体机器人和植物大战僵尸的僵尸做类比)
这种先进性的内涵是:
可以让组织保持基本稳态的前提下持续产生跃迁。
**这种先进性的根本中精神大于物质,但不适**合简单二元论,而是两者的按特定配比的综合。(和决定战争胜利的是人而不是物也不在一个层次上)
如果这么定义先进性,**那两类偏颇场都是有问题的:**
**一种是超级稳态场,一种是活性但容易崩坏的场。**从组织的间断平衡角度看,我们可以这么讲。
有些组织会进入超稳态,它在既有的赛道上把自己强化的很好。内部利益分配各种与其适应。(创新者窘境用价值观、流程来描述,但其实还是缺东西,不过价值观、流程已经比人才密度的视角好很多了,毕竟是场的一部分)
**(那根破坏性创新增长曲线背后的原**动力是什么?是人才密度、机器、资金么?)
可以形象点来说这个问题。
比如猩猩某些方面强化的其实比人好。
我们古代在农业文明上进化的其实比欧洲好。
这种好,会导致组织和个体进入超稳态。
这种超稳态会内置妨碍跃迁的力量。
这一点点差异,在大时间轴上,效果就非常明显。
那先进性就是既有稳态,又有足够的活性。
OpenAI差点没把Altman干跑就是活性过剩,能够纠正回来说明还是有稳态力量。
但一路前跑,则是活性场产生的推动力。
这种场才可能构建出一种在稳态中行进,还具有跃迁力量的组织。
这种跃迁的力量是精神与技术的综合。
**柔性场的构建成本和难度都是高的**。
## **假如不看场,只看人会怎么样**
最典型的是面对内部大规模耗散时采取的措施会有雷同性。
组织中很容易进入一种大家一起磨叽的状态(高深的词可以叫熵增)。我们对付这种耗散只有一种方法就是揍它。回到修长城的方式。前一阵有人在朋友圈发了一个段子,倒是正好和这个呼应。
**中国式管理,理论核心就三点:**
1. **你干的好,是因为我领导有方。**
1. 你干不好就是你有问题,和我没关系。
1. **你不干有的是人干。**
**这个正好形象的体现了只关注人财物有形要素不关注场的表现(非常**闭环和形象,通过人事变动3是可以回到1的。
注定的后果就一定是不停内部倒腾,这种场的特征和组织行为表现具有极大的相关性,包括对强人的渴望,学习刘邦这一套东西都是伴生特征。但实际上这是在狮子社会里面都能看到的古老模式。仍然有用,但估计搞不定人工智能这样的领域。
**这背后的认识差距是真正的差距。**
**如**果上面的解读是对的,那么我们在人才密度什么上面的努力就很像缘木求鱼,根本改变不了局面(猴子水中捞月式追赶),而标题上的问题则会不停的被问。(超稳态)
难的也正是这里,如果说有形要素的改变是旦夕之功可达,那这种先进场的构建就有点十年树木百年树人百年树人的意思了,并且破功还很容易。
借助AI这种场的形成成本也许可以降下来,但认知的事就会比较困难。转过来后对问题的反省会完全不一样,比如:
但反过来如果场大于个人,那是这样的思维链条:
**落后了**
**场不行**
**进行机制建设**
**个体和整体活性增加**
**也许动荡,但保持活性迭代**
这里的关键在于怎么才能产生更多的活性个体并且乱而不散。
**也会很多混乱甚至崩溃,比如OpenAI**自己的内讧,但跃迁到下一层的可能性是高的。
(从间断平衡的视角看组织的话,什么能构成跃迁的力量呢?)
## **扩散一点点**
假如有一池水,有点颜色,在这里面有一些独立的缸,那缸里的问题是不是都是池子的问题?
我觉得在AI这个事上,主要不是,毕竟保留了足够的自由度。但确实池子的偏好会在长时间轴上有很根本的影响。
## **小结**
看着简单但其实这是一个超级复杂的话题,近来看很多人在探讨这个,所以还是从这个视角说说自己的观点,简单说就是:
组织里面人之外有场,叠加后才是最终组织特征。
**如**果我们总是用人才密度,钱不够这样的视角去看待问题,那就很难适应这种高速进化的领域,陷入一种追平,落后再追赶的困局。
倒是也闭环,不愁没事干。
# 中国人工智能属于第几梯队?
> 来源:[https://aigcreative.feishu.cn/docx/NRbxd286Ro04RkxEQz6cGfdin2b](https://aigcreative.feishu.cn/docx/NRbxd286Ro04RkxEQz6cGfdin2b)
> 作者:贾铭
> 公众号:秦朔朋友圈
> 链接:https://mp.weixin.qq.com/s/p3ASMcAfzDfgZ_QyzdKKKQ
早在ChatGPT出现时,有很多人也讨论过“ChatGPT为什么没有首先出现在中国”。而当我们还在困扰为什么国内大模型没有GPT4好用的时候,Sora来了。
从通用人工智能(AGI)视角看,这意味着我们与OpenAI的差距又被拉大了。
中国人工智能发展的制约因素是什么?当前的发展到底处于第几梯队?2023年下半年,我密集调研了十几家人工智能企业,来宽泛地谈谈我自己的看法。
# **算力**
算力是人工智能竞争的核心,算力的背后是芯片。
Meta一家公司已经有50万块GPU,微软**也有几十万块,而且两家公司还在不断采购。国内所有的人工智**能公司加在一起,可能有50万块左右,所以在算力的存量层面,我们跟国外的差距很大。
芯片又分为芯片设计和芯片制造。中国的芯片设计能力在全球应该可以划分到第一梯队。在传统的CPU和GPU领域,与国外几乎没有差距。在人工智能芯片的细分领域,比如半定制化的FPGA、全定制化的ASIC、类脑芯片等领域,已经有个别很优秀的公司极度贴近甚至部分超越国际顶尖水平,但顶尖公司的数量和生态,总体上与国外发达国家还有不小的差距。
在芯片制造环节,面临卡脖子。
从制程上看,90nm以上制程的芯片,技术上我们已经几乎可以完全自主。有消息说,2023年下半年,28nm的国产(后道封装)光刻机也已经交付芯片制造厂商。但也有消息说,仍然正在研发,还没有交付。
即使已经交付芯片制造商,在一切顺利的情况下,参考阿斯麦(ASML)和台积电的经验,从安装完成、调试到可以稳定生产,至少需要2年的时间。考虑到这是中国首台全国产的28nm光刻机,以及光刻机的高度复杂性,所需时间大概率会更长。
|荷兰光刻机巨头阿斯麦公司(ASML)总部
特别需要注意的是,光刻机完成实验室阶段的研发和在厂商完成产业化生产是完全不同的两个概念。
在研发阶段,只要成功流片,就算是研发成功,但在实际的产业应用阶段,要求在保证良率和产能的情况下,能够安全稳定地持续运营,这个过程是很难的。
所以,光刻机从实验研发到正式投产,花费十年八年都是很正常的。即使ASML,前几款光刻机,从研发成功到正式投产,也在5年以上。
至于28nm以下的芯片制造,必须还要依赖国外的光刻机。
当前全球的光刻机市场被荷兰阿斯麦(ASML)、日本尼康(Nikon)和佳能(Canon)三大巨头垄断。尼康的光刻机集中在中高端区域,佳能则集中在低端区域。
至于2023年某厂商成功制造5nm的芯片,业内普遍推测,芯片自主设计是没问题的,但在制造环节,使用的还是国外的设备,区别无非是ASML的还是Nikon或者Canon的。
光刻产业链具有极度复杂性。光刻机的制造研发绝不是某一个企业能够单独完成的(包括ASML也不是一家就能造DUV和EUV,很多核心零部件都要进口),需要很多顶尖的企业相互配合才可以完成。
光刻产业链的高度复杂性主要体现在两点:
**一是**作为光刻核心设备的光刻机组件复杂,包括光源系统、照明系统、物镜系统、浸入式系统、双工件台等在内的组件技术全球只有极少数几家公司能够掌握。比如物镜镜片被德国企业蔡司(ZEISS)垄断。
**二是**与光刻机配套的光刻胶、光刻气体、掩膜版等半导体材料和涂胶显影设备等同样要求很高的技术含量。比如,宽谱g/i/h线光刻胶基本完成国产替代,但高端KrF、ArF和EUV光刻胶基本被美国和日本的企业垄断,韩国企业占一点比重,中国大陆基本依靠进口。
现在的问题是ASML被限制向中国出口最新的光刻机,英伟达(NVIDIA)被限制向中国出口最新的芯片。
虽然我们还可以买到性能受限的“特供版”芯片,但限售既限制了企业的算力获取,又拉高了算力成本,而且扰乱了企业的研发预期。
短期来看,部分企业有储备算力可供使用,而且现在也没有到单纯拼算力的地步,算法依然有很大的优化提升空间。但长远来看,仅从技术的角度,人工智能竞争的本质还是算力的竞争。
尽管当前我们已经加大在半导体领域的研发投入,但短期内中国在芯片制造领域取得颠覆性突破的困难还比较大,所以未来在算力竞争层面,无论是国家还是企业,都要提前做好各方面的应对准备。
|2006年全球首台EUV光刻机原型
# **数据**
数据是重要的基础性战略资源,高质量数据对人工智能的重要性无需赘言。
中国是世界上数据最丰富、也是最重视数据的国家之一,将数据的重要性提升到了前所未有的高度,专门设立了国家大数据局,并出台了系列法律法规和行业规范。
“数据二十条”针对数据要素与其他生产要素的不同特点,构建起“四梁八柱”的主要架构,从数据产权、流通交易、收益分配、安全治理四方面初步搭建了中国的数据基础制度体系。
当然,数据二十条只是纲领性文件,未来许多更具体的内容需要不断探索发展。数据交易所的建设效果如何,还有待观察。
就目前来看,至少存在三方面的问题——
**第一**是优质数据太少,很多企业需要花大成本重新清洗和标注数据。所以经常有人开玩笑说:人工智能,有多少人工就有多少智能。
**第二**,数据的灰色交易问题。有的行业或者企业可以更优先拿到部分受限的数据,由于数据复用的边际成本极低,所以很多企业就通过不合规的渠道以很低的价格买卖数据,导致不公平竞争。
**第三**,数据的保护和治理水平还有待提高。数据中敏感信息多,许多数据内容多层次多元化,可能承载了需要保护的个人信息和商业机密,即使匿名化和去标识化,也有可能被挖掘出来。
# **资本**
如果只看ChatGPT的技术路线的话,其实是一个大力出奇迹的过程。
很多公司都曾经实验过这一技术路线,但都受限于算力成本和数据量,在做了一段时间后就放弃了。
不仅是国内的很多公司没有做出来,Google也没有做出来。只有OpenAI不断地堆算力、堆数据,最终实现了由量变到质变。所以,ChatGPT的成功具有一定的偶然性。
但偶然中又蕴含着必然。仅就人工智能领域来说,中国好像并没有做出太杰出的原创性贡献。AlphaGo,ChatGPT是国外先出现的,智能音箱、智能驾驶、人脸识别,都是人工智能的工程应用,也不是中国的原创。
有很多人说,国外有成熟的投融资体系,所以可以支持OpenAI不断烧钱。
确实,原创性的科技创新投入大、周期长、成功概率低。OpenAI的资金密度、人才密度都很高。而中国的多层次资本市场仍不够健全,尤其是VC和PE市场建设比较滞后。未来还是需要花大力气完善。
但我觉得这不是根本原因。
一般的中小公司很难获得如OpenAI那么多的融资,但如果我们仔细统计,在2022年ChatGPT横空出世以前,中国有不少公司的融资额是比OpenAI还多的,但我们还是没有做出ChatGPT。
所以投融资很重要,资本市场很重要。但融资额多少不是创新成功与否的决定性因素。
# **人才**
颠覆性技术创新的核心要素是“人”。
如果让我们回顾一份具有世界影响力的科技创新者名单,可能会包括Bill Gates、Zuckerberg、Sam Altman、 Elon Mask等等。
中国人口基数这么大,我们缺的不是Altman和Mask这样的种子,缺的是让这些种子从生根发芽到长成参天大树的土壤。
深层次反思是需要勇气的,而且很不讨喜。当大家都沉浸在热烈的人工智能浪潮中,沉浸在中国人工智能处于世界领先行列的喜悦中,我非说我们这里不行,那里有短板,就很容易挨骂。
但我们的人才培养模式确实有问题。
高校是我们人才培养最重要的载体。但我们的**高等教育培养的大部分是落后于实践的人才。我们高校的环境鼓励**的是“边际创新”而不是“原创性成果”。我们的社会容不下坐几年十几年冷板凳的人才。
**第一**,高校都想做大,做综合类高校,开设最热门的学科,尽可能招更多的学生。因为学科建设、学生规模与能获得的经费支持直接相关。
最显著的一个表征就是,各类“xxx学院”都争相想改名成“xxx大学”。高校的数量要适应当地的经济发展程度和人口规模。有的省份经济发展水平比较高,人口规模也很大,但优质的教育资源不足,在能保障教学质量的情况下,可以考虑扩大供给,但学科设置不能脱离自己的比较优势。
前几年金融学是热门学科,所以很多学校就竞相设置经管学院、经济系。我知道有的专科院校,竟然也设置了诸如“金融工程”之类对师资力量要求很高的学科。这种情况下培养出来的人才,只是虚有其表。
据不完全统计,截至2023年,全国有440所高校建立了人工智能本科专业,有1016所职业院校备案了人工智能技术服务(应用)专业。
人工智能也是一个对师资力量要求很高的学科,如果专科院校开设人工智能专业,必须要找准自己的定位,稳扎稳打,侧重于应用开发和改进、应用测试、数据处理、产品运维、商务推广、产品销售、售后服务等实用技能型人才培养,与本科和研究生进行差异化竞争。
**第二**,人工智能对硬件和软件的要求都很高,高校的算力和数据资源、师资力量、课程设置和传授的知识落后于行业实践,背后是产教融合的问题。
一方面,大部分高校的算力和数据资源其实难以满足大模型的教学和研发需求。另一方面,无论是老师的教学能力还是课程设置,都落后于行业一线。这两方面的问题不仅在人工智能行业存在,在各行各业都存在。
我们在调研中,多家企业都反馈,招聘的算法类应届毕业生至少都要花费1~2年重新培养,而工作2年的员工离职率最高,所以有的企业选择不再招聘应届生,而直接高薪挖人,这就加剧了行业内卷。
集成电路企业对人才的要求更高。由于芯片设计的复杂性,从业5年才算上手,从业10年才算成熟人才。现在高校培养的大部分是通用型的传统集成电路设计人才,难以适应全定制和半定制化人工智能芯片的设计要求。
所以业内现状是,领军人才、成熟技术人才供不应求,而应届生和“转码”人才又存在过剩。
而在产学研方面,具有一定规模和技术实力的大企业数量有限,专精特新等中小型科技类企业具有技术优势,但由于很难给高校带来立竿见影的资金和就业支持,用人需求和技术优势,都难以触达高校。
美国顶尖大学的教授,除去必要的上课时间,其它时间可以到企业的实验室工作,因此了解产业界的真实需求。国内也有相应的产学结合制度,比如在企业设立院士工作站等等,但这个制度的效果还不够好,具体原因比较复杂。很多科研人员一辈子都没有下过工厂。
国内还有一个很不好的习惯:很多科技成果是为了转化而转化,也就是基于已经拥有的技术或者解决方案来开发新的应用场景,这就导致很多研究不仅没有解决已经存在的重要问题,反而又创造出新的问题。
长期以来,中国教育重传承、轻创新,重标准化教育、轻个性化教育,重知识吸收、轻价值塑造和创新创业,同时中国创新人才教育模式较单一,缺乏多元化投入机制,培养颠覆性技术创新型人才面临困难和挑战。
**第三**,科研工作者的职称考评压力很大,而职称考评是有量化标准的,大部分是“课题+论文发表”。近几年越来越卷,职称考评的标准越来越高。
一位来自知名双一流高校,在我看来很有才华和前途的年轻副教授跟我说:“我也想把所有的精力投入到科技创新中去,我的学院领导也已经是非常开明的领导了,不要求我每年发多少篇论文,支持我和团队花几年的时间搞一个大项目。但是他要求我承诺未来一定要做出什么样的成果。我只能承诺我全力以赴,但我怎么能预先确定科技创新的成败呢?”
当前的问题在于,无论是部委课题还是基金课题,大部分的研究期限很短,且必须承诺结题成果,这似乎可以保障科研质量,避免科研经费被浪费,但这同时导致学者只申请有把握能在短期内达标结题的课题,实际上限制了院校和学者进行基础研究的攻关热情。
这就导致,中国在人工智能领域的顶刊论文数量超过美国,但实际上大多数是对国际前沿理论的边际改善,产业应用价值较弱。
现在国家也在转变科研方式,比如指定或者征集重大问题、延长项目周期、增大重点项目投入。在科研考评体系方面,推进“破五维”。
一方面,像中国自然科学基金就有一整套匿名评审机制和同行评价制度,大家的认可度还比较高。除了项目评价,高校在选人方面也应该增加同行评价的比重。有的博士甚至一篇论文都没有,也可以在国外拿到教职。国外在选人时,更侧重评价一个青年学者的潜力,哪怕你还没研究出真正的成果,但我只要能判断出你研究的问题本身重要,就能评价一个人的科研品味。
**国外本质上更注重一个人的内涵和科研潜力,但国内习惯用公式一样的指标来**判断一个人,最后就导致所有的青年学者趋同,适应评价规则的同时,也扼杀了科研潜力。
现在已经有很多学校把招人的权力下放到了院系,但院系仍然沿用既往的选才制度。
“破五维”的效果不及预期,而且如果真的“破五维”之后,尚未建立起一套新的标准,可能会导致更多的问题。原因既包括既得利益格局的桎梏,也包括面临公平问题和舆论压力。
另一方面,就目前来看,指定或者征集重大问题、“揭榜挂帅”,是一种很好的措施,抓住了当前最迫切的问题,显著推进了问题的解决速度,是急国家之所急。但这更多的是促进了工程应用问题的解决,而不是真正意义上的“颠覆性创新”。
重大项目方面,虽然延长了项目周期、增加了项目额度,但这些重大项目还是主要集中在院士、教授手中。
但很多人评为教授、院士之后,实际上已经不再关注学术前沿,反而成了学术资源的主要提供方,成了一个巨大的利益焦点。院士手上的钱用不完,天天想着怎么花钱,而年轻的科学家找不到钱,无钱可用。所以,科学家共同体内部也需要一些机制来变革。
客观地说,经过多年的发展,综合来看,中国高校的师资力量、人才培养质量已经并不明显落后于西方发达国家。尤其是在人工智能领域,各国(包括美国),都存在顶尖人才短缺的情况,美国业界甚至采取“杀鸡取卵”的方式用高薪从高校挖教授。
中国部分高校开设的人工智能课程,在授课内容、方式、人才培养质量上已经达到了世界顶级水平。这与国家的重视有很大的关系,也与我们的激励制度导向有关。比如我们设立的青年长江学者,就很重视对教学的考核。学校对优秀教学教师的奖励力度也很大。我们有理由对中国人才培养的未来饱含希望。
# **环境**
**第**一,中国人的生活压力其实很大,整个社会环境比较急功近利,对科技创新的要求非常苛刻,个人的容错率非常低。
社会环境对基础创新非常重要。其一,基础研究短期很难出成果,无论是上级监管部门,还是科研院所,都很难承担这种“只烧钱但看不到成果”的考核压力;其二,公众的科学素养也有待提高,大家对很多研究领域的认知不到位,迫切的期待科学家短期做出重大成果,如果长时间不出成果,机构和个人都很难承受舆论压力;其三,个人收入、职业发展与科研成果挂钩。如果你想在高校/科研院所获得还说得过去的收入,得到学校和社会的认可,那你必须在有限的时间内把有限的精力投入到漫长的论文发表的事业中去。而且我们很多课题和“帽子”,都限制了申请者的年龄。这就导致大家只在前人的基础上进行有效的边际创新——因为这是“性价比”最高的方式。
所以,我们要花大力气提升大众的科学素养,社会上要有一种正确的风气,不要一窝蜂,好像重视一个科学家,某个领域的科学研究就要有重大的突破,如果科学家失败了,就觉得这个人有问题或者怎么样。
**第二,营商环境还有提升空间。**
我们过去很长一段时间内,都非常重视营商环境的建设,取得了很大的成效。无论是在国际组织还是国内组织编篡的各类营商环境国别榜单中,排名和评分都有显著的上升。
人工智能技术的发展对未来很多行业可能产生颠覆性影响,世界很多国家都将人工智能技术放在了战略重要性的地位,中国也是如此。
在这个背景下,中央政府、各部委不可谓不重视,出台了很多支持政策。各地方政府对人工智能的支持力度不可谓不大,只要头部企业愿意落户,要地给地、要钱给钱、要人给人,堪称全方位无死角的支持。
但我们对恶意负面舆情的治理力度还不够。有很多所谓的网络“大V”依旧很活跃,受众还很广。
恶意的负面舆情对企业的社会名誉影响很大,甚至扰乱企业的正常经营,对上市公司的影响更大。人工智能行业很有意思,大多数企业都是民营企业。在这种情况下,我们更应该重视恶意攻击民营企业和民营企业家的行为。
我当然知道,舆论不可能也不该禁绝,有时候舆论还是弱者维护自身权益的武器,正常的负面舆情对企业也是一种监督。所以我们要抓大放小,对打着爱国旗号,但实质上攻击企业正常经营行为、造成重大社会影响的恶性舆情和谣言要寻根问底,发现一起,惩治一起。最好是公开执法,一方面是保障执法的公开公正,另一方面是可以震慑宵小,以儆效尤。
# **总结**
一位科技企业的资深技术专家和管理者曾经跟**我说,中国的人工智能其**实准确来说应该叫做“人工智能的工程应用”,我们经常有种幻觉,很多技术我们应用得很好,我们就误认为我们掌握了某种技术。
在应用场景方面,不客气地说,中国的人工智能可以说是冠绝全球,一骑绝尘。
但对技术的应用只是“1到100”。“1到100”很重要,但“0到1”更重要。比如,你肯定比牛顿懂得多,但你跟牛顿谁伟大?
客观上来说,国外在人工智能方面可能确实有先发优势。二十世纪三个伟大的发现,无线电、计算机和互联网都出现在美国,一个重要原因就是它的基础、应用以及开发研究都非常强大。
但我们有很多机制、体制,甚至文化方面的因素,限制了我们0到1的创新。
在人工智能领域,尤其是在芯片制造等基础层,我们真正距离挤入世界顶尖梯队还任重道远。
但只要我们保持战略定力,实事求是、脚踏实地、一步一个脚印,我们就有一万个理由对未来充满希望。
# 这是一篇关于人工智能的最强科普!
> 来源:[https://aigcreative.feishu.cn/docx/Usm6dzu5porMKRxs950cMeHunLd](https://aigcreative.feishu.cn/docx/Usm6dzu5porMKRxs950cMeHunLd)
> **译者:谢熊猫君**
> **内容**来源:The AI Revolution:Road to Superintelligence & The AI Revolution:Our Immortality or Extinction
人工智能很可能导致人类的永生或者灭绝,而这一切很可能在我们的有生之年发生。
上面这句话不是危言耸听,请耐心的看完本文再发表意见。这篇翻译稿翻译完一共三万五千字,我从上星期开始翻,熬了好几个夜才翻完,因为我觉得这篇东西非常有价值。希望你们能够耐心读完,读完后也许你的世界观都会被改变。
## 我们正站在变革的边缘,而这次变革将和人类的出现一般意义重大。
如果你站在这里,你会是什么感觉?
看上去非常刺激吧?但是你要记住,当你真的站在时间的图表中的时候,你是看不到曲线的右边的,因为你是看不到未来的。所以你真实的感觉大概是这样的:
稀松平常。
## **遥远的未来——就在眼前**
想象一下坐时间机器回到1750年的地球,那个时代没有电,畅通通讯基本靠吼,交通主要靠动物拉着跑。你在那个时代邀请了一个叫老王的人到2015年来玩,顺便看看他对“未来”有什么感受。我们可能没有办法了解1750年的老王内心的感受——金属铁壳在宽敞的公路上飞驰,和太平洋另一头的人聊天,看几千公里外正在发生进行的体育比赛,观看一场发生于半个世纪前的演唱会,从口袋里掏出一个黑色长方形工具把眼前发生的事情记录下来,生成一个地图然后地图上有个蓝点告诉你现在的位置,一边看着地球另一边的人的脸一边聊天,以及其它各种各样的黑科技。别忘了,你还没跟他解释互联网、国际空间站、大型强子对撞机、核武器以及相对论。
**这时候的老王会是什么体验?惊讶、震惊、脑洞大开这些词都**太温顺了,我觉得老王很可能直接被吓尿了。
但是,如果老王回到了1750年,然后觉得被吓尿是个很囧的体验,于是他也想把别人吓尿来满足一下自己,那会发生什么?于是老王也回到了250年前的1500年,邀请生活在1500年的小李去1750年玩一下。小李可能会被250年后的很多东西震惊,但是至少他不会被吓尿。同样是250来年的时间,1750和2015年的差别,比1500年和1750年的差别,要大得多了。1500年的小李可能能学到很多神奇的物理知识,可能会惊讶于欧洲的帝国主义旅程,甚至对于世界地图的认知也会大大的改变,但是1500年的小李,看到1750年的交通、通讯等等,并不会被吓尿。
所以说,对于1750年的老王来说,要把人吓尿,他需要回到更古老的过去——比如回到公元前12000年,第一次农业革命之前。那个时候还没有城市,也还没有文明。一个来自狩猎采集时代的人类,只是当时众多物种中的一个罢了,来自那个时代的小赵看到1750年庞大的人类帝国,可以航行于海洋上的巨舰,居住在“室内”,无数的收藏品,神奇的知识和发现——他很有可能被吓尿。
小赵被吓尿后如果也想做同样的事情呢?如果他会到公元前24000年,找到那个时代的小钱,然后给他展示公元前12000年的生活会怎样呢。小钱大概会觉得小赵是吃饱了没事干——“这不跟我的生活差不多么,呵呵”。小赵如果要把人吓尿,可能要回到十万年前或者更久,然后用人类对火和语言的掌控来把对方吓尿。
所以,一个人去到未来,并且被吓尿,他们需要满足一个“吓尿单位”。满足吓尿单位所需的年代间隔是不一样的。在狩猎采集时代满足一个吓尿单位需要超过十万年,而工业革命后一个吓尿单位只要两百多年就能满足。
未来学家RayKurzweil把这种人类的加速发展称作加速回报定律(LawofAcceleratingReturns)。之所以会发生这种规律,是因为一个更加发达的社会,能够继续发展的能力也更强,发展的速度也更快——这本就是更加发达的一个标准。19世纪的人们比15世纪的人们懂得多得多,所以19世纪的人发展起来的速度自然比15世纪的人更快。
即使放到更小的时间规模上,这个定律依然有效。著名电影《回到未来》中,生活在1985年的主角回到了1955年。当主角回到1955年的时候,他被电视刚出现时的新颖、便宜的物价、没人喜欢电吉他、俚语的不同而震惊。
但是如果这部电影发生在2015年,回到30年前的主角的震惊要比这大得多。一个2000年左右出生的人,回到一个没有个人电脑、互联网、手机的1985年,会比从1985年回到1955年的主角看到更大的区别。
这同样是因为加速回报定律。1985年-2015年的平均发展速度,要比1955年-1985年的平均发展速度要快,因为1985年的世界比1955年的更发达,起点更高,所以过去30年的变化要大过之前30年的变化。
进步越来越大,发生的越来越快,也就是说我们的未来会很有趣对吧?
未来学家Kurzweil认为整个20世纪100年的进步,按照2000年的速度只要20年就能达成——2000年的发展速度是20世纪平均发展速度的5倍。他认为2000年开始只要花14年就能达成整个20世纪一百年的进步,而之后2014年开始只要花7年(2021年),就能达到又一个20世纪一百年的进步。几十年之后,我们每年都能达成好几次相当于整个20世纪的发展,再往后,说不定每个月都能达成一次。按照加速回报定,Kurzweil认为人类在21世纪的进步将是20世纪的1000倍。
**如果Kurzweil等人的想法是正确的,那2030年的世界可能就能把**我们吓尿了——下一个吓尿单位可能只需要十几年,而2050年的世界会变得面目全非。
你可能觉得2050年的世界会变得面目全非这句话很可笑,但是这不是科幻,而是比你我聪明很多的科学家们相信的,而且从历史来看,也是逻辑上可以预测的。
那么为什么你会觉得“2050年的世界会变得面目全非”这句话很可笑呢?有三个原因让你质疑对于未来的预测:
## 1.我们对于历史的思考是线性的。
当我们考虑未来35年的变化时,我们参照的是过去35年发生的事情。当我们考虑21世纪能产生的变化的时候,我们参考的是20世纪发生的变化。这就好像1750年的老王觉得1500年的小李在1750年能被吓尿一样。线性思考是本能的,但是但是考虑未来的时候我们应该指数地思考。一个聪明人不会把过去35年的发展作为未来35年的参考,而是会看到当下的发展速度,这样预测的会更准确一点。当然这样还是不够准确,想要更准确,你要想象发展的速度会越来越快。
## 2.近期的历史很可能对人产生误导。
首先,即使是坡度很高的指数曲线,只要你截取的部分够短,看起来也是很线性的,就好像你截取圆周的很小一块,看上去就是和直线差不多。其次,指数增长不是平滑统一的,发展常常遵循S曲线。
S曲线发生在新范式传遍世界的时候,S曲线分三部分:
慢速增长(指数增长初期);快速增长(指数增长的快速增长期);
随着新范式的成熟而出现的平缓期。
如果你只看近期的历史,你很可能看到的是S曲线的某一部分,而这部分可能不能说明发展究竟有多快速。1995-2007年是互联网爆炸发展的时候,微软、谷歌、脸书进入了公众视野,伴随着的是社交网络、手机的出现和普及、智能手机的出现和普及,这一段时间就是S曲线的快速增长期。2008-2015年发展没那么迅速,至少在技术领域是这样的。如果按照过去几年的发展速度来估计当下的发展速度,可能会错得离谱,因为很有可能下一个快速增长期正在萌芽。
## 3.个人经验使得我们对于未来预期过于死板。
我们通过自身的经验来产生世界观,而经验把发展的速度烙印在了我们脑中——“发展就是这么个速度的。”我们还会受限于自己的想象力,因为想象力通过过去的经验来组成对未来的预测——但是我们知道的东西是不足以帮助我们预测未来的。当我们听到一个和我们经验相违背的对于未来的预测时,我们就会觉得这个预测偏了。如果我现在跟你说你可以活到150岁,250岁,甚至会永生,你是不是觉得我在扯淡——“自古以来,所有人都是会死的。”是的,过去从来没有人永生过,但是飞机发明之前也没有人坐过飞机呀。
**接下**来的内容,你可能一边读一边心里“呵呵”,而且这些内容可能真的是错的。但是如果我们是真的从历史规律来进行逻辑思考的,我们的结论就应该是未来的几十年将发生比我们预期的多得多得多得多的变化。同样的逻辑也表明,如果人类这个地球上最发达的物种能够越走越快,总有一天,他们会迈出彻底改变“人类是什么”这一观点的一大步,就好像自然进化不不断朝着智能迈步,并且最终迈出一大步产生了人类,从而完全改变了其它所有生物的命运。如果你留心一下近来的科技进步的话,你会发现,到处都暗示着我们对于生命的认知将要被接下来的发展而彻底改变。
## 通往超级智能之路——人工智能是什么?
如果你一直以来把人工智能(AI)当做科幻小说,但是近来却不但听到很多正经人严肃的讨论这个问题,你可能也会困惑。这种困惑是有原因的:
1.我们总是把人工智能和电影想到一起。星球大战、终结者、2001:太空漫游等等。电影是虚构的,那些电影角色也是虚构的,所以我们总是觉得人工智能缺乏真实感。
**2.人工智能是个很宽泛的话题。**从手机上的计算器到无人驾驶汽车,到未来可能改变世界的重大变革,人工智能可以用来描述很多东西,所以人们会有疑惑。
3.我们日常生活中已经每天都在使用人工智能了,只是我们没意识到而已。JohnMcCarthy,在1956年最早使用了人工智能(ArtificialIntelligence)这个词。他总是抱怨“一旦一样东西用人工智能实现了,人们就不再叫它人工智能了。”
因为这种效应,所以人工智能听起来总让人觉得是未来的神秘存在,而不是身边已经存在的现实。同时,这种效应也让人们觉得人工智能是一个从未被实现过的流行理念。Kurzweil提到经常有人说人工智能在80年代就被遗弃了,这种说法就好像“互联网已经在21世纪初互联网泡沫爆炸时死去了”一般滑稽。
所以,让我们从头开始。
首先,不要一提到人工智能就想着机器人。机器人只是人工智能的容器,机器人有时候是人形,有时候不是,但是人工智能自身只是机器人体内的电脑。人工智能是大脑的话,机器人就是身体——而且这个身体不一定是必需的。比如说Siri背后的软件和数据是人工智能,Siri说话的声音是这个人工智能的人格化体现,但是Siri本身并没有机器人这个组成部分。
其次,你可能听过“奇点”或者“技术奇点”这种说法。这种说法在数学上用来描述类似渐进的情况,这种情况下通常的规律就不适用了。这种说法同样被用在物理上来描述无限小的高密度黑洞,同样是通常的规律不适用的情况。Kurzweil则把奇点定义为加速回报定律达到了极限,技术进步以近乎无限的速度发展,而奇点之后我们将在一个完全不同的世界生活的。但是当下的很多思考人工智能的人已经不再用奇点这个说法了,而且这种说法很容易把人弄混,所以本文也尽量少用。
最后,人工智能的概念很宽,所以人工智能也分很多种,我们按照人工智能的实力将其分成三大类。
**弱人工智能**ArtificialNarrowIntelligence(ANI):弱人工智能是擅长于单个方面的人工智能。比如有能战胜象棋世界冠军的人工智能,但是它只会下象棋,你要问它怎样更好地在硬盘上储存数据,它就不知道怎么回答你了。
**强人工智能**ArtificialGeneralIntelligence(AGI):人类级别的人工智能。强人工智能是指在各方面都能和人类比肩的人工智能,人类能干的脑力活它都能干。创造强人工智能比创造弱人工智能难得多,我们现在还做不到。LindaGottfredson教授把智能定义为“一种宽泛的心理能力,能够进行思考、计划、解决问题、抽象思维、理解复杂理念、快速学习和从经验中学习等操作。”强人工智能在进行这些操作时应该和人类一样得心应手。
**超人工智能**ArtificialSuperintelligence(ASI):牛津哲学家,知名人工智能思想家NickBostrom把超级智能定义为“在几乎所有领域都比最聪明的人类大脑都聪明很多,包括科学创新、通识和社交技能。”超人工智能可以是各方面都比人类强一点,也可以是各方面都比人类强万亿倍的。超人工智能也正是为什么人工智能这个话题这么火热的缘故,同样也是为什么永生和灭绝这两个词会在本文中多次出现。
现在,人类已经掌握了弱人工智能。其实弱人工智能无处不在,人工智能革命是从弱人工智能,通过强人工智能,最终到达超人工智能的旅途。这段旅途中人类可能会生还下来,可能不会,但是无论如何,世界将变得完全不一样。
让我们来看看这个领域的思想家对于这个旅途是怎么看的,以及为什么人工智能革命可能比你想的要近得多。
## 我们所处的位置——充满弱人工智能的世界
弱人工智能是在特定领域等同或者超过人类智能/效率的机器智能,一些常见的例子:
汽车上有很多的弱人工智能系统,从控制防抱死系统的电脑,到控制汽油注入参数的电脑。谷歌正在测试的无人驾驶车,就包括了很多弱人工智能,这些弱人工智能能够感知周围环境并作出反应。
你的手机也充满了弱人工智能系统。当你用地图软件导航,接受音乐电台推荐,查询明天的天气,和Siri聊天,以及其它很多很多应用,其实都是弱人工智能。
垃圾邮件过滤器是一种经典的弱人工智能——它一开始就加载了很多识别垃圾邮件的智能,并且它会学习并且根据你的使用而获得经验。智能室温调节也是一样,它能根据你的日常习惯来智能调节。
你在上网时候出现的各种其它电商网站的产品推荐,还有社交网站的好友推荐,这些都是弱人工智能的组成的,弱人工智能联网互相沟通,利用你的信息来进行推荐。网购时出现的“买这个商品的人还购买了”推荐,其实就是收集数百万用户行为然后产生信息来卖东西给你的弱人工智能。
谷歌翻译也是一种经典的人工智能——非常擅长单个领域。声音识别也是一种。很多软件利用这两种智能的合作,使得你能对着手机说中文,手机直接给你翻译成英文。
当飞机着陆时候,不是一个人类决定飞机该去那个登机口接驳。就好像你在网上买票时票据不是一个人类决定的。
世界最强的跳棋、象棋、拼字棋、双陆棋和黑白棋选手都是弱人工智能。
谷歌搜索是一个巨大的弱人工智能,背后是非常复杂的排序方法和内容检索。社交网络的新鲜事同样是这样。
这些还只是消费级产品的例子。军事、制造、金融(高频算法交易占到了美国股票交易的一半)等领域广泛运用各种复杂的弱人工智能。专业系统也有,比如帮助医生诊断疾病的系统,还有著名的IBM的华生,储存了大量事实数据,还能理解主持人的提问,在竞猜节目中能够战胜最厉害的参赛者。
现在的弱人工智能系统并不吓人。最糟糕的情况,无非是代码没写好,程序出故障,造成了单独的
灾难,比如造成停电、核电站故障、金融市场崩盘等等。
虽**然现在的弱人工智能没有威胁我们生**存的能力,我们还是要怀着警惕的观点看待正在变得更加庞大和复杂的弱人工智能的生态。每一个弱人工智能的创新,都在给通往强人工智能和超人工智能的旅途添砖加瓦。用AaronSaenz的观点,现在的弱人工智能,就是地球早期软泥中的氨基酸——没有动静的物质,突然之间就组成了生命。
## **弱人工智能到强人工智能之路**
为什么这条路很难走?
只有明白创造一个人类智能水平的电脑是多么不容易,才能让你真的理解人类的智能是多么不可思议。造摩天大楼、把人送入太空、明白宇宙大爆炸的细节——这些都比理解人类的大脑,并且创造个类似的东西要简单太多了。至今为止,人类的大脑是我们所知宇宙中最复杂的东西。
而且创造强人工智能的难处,并不是你本能认为的那些。
造一个能在瞬间算出十位数乘法的计算机——非常简单;
造一个能分辨出一个动物是猫还是狗的计算机——极端困难;
造一个能战胜世界象棋冠军的电脑——早就成功了。
造一个能够读懂六岁小朋友的图片书中的文字,并且了解那些词汇意思的电脑——谷歌花了几十亿美元在做,还没做出来。
一些我们觉得困难的事情——微积分、金融市场策略、翻译等,对于电脑来说都太简单了
**我们觉得容易的事情——视觉、动态**、移动、直觉——对电脑来说太TM的难了。
用计算机科学家DonaldKnuth的说法,“人工智能已经在几乎所有需要思考的领域超过了人类,但是在那些人类和其它动物不需要思考就能完成的事情上,还差得很远。”
读者应该能很快意识到,那些对我们来说很简单的事情,其实是很复杂的,它们看上去很简单,因为它们已经在动物进化的过程中经历了几亿年的优化了。当你举手拿一件东西的时候,你肩膀、手肘、手腕里的肌肉、肌腱和骨头,瞬间就进行了一组复杂的物理运作,这一切还配合着你的眼睛的运作,使得你的手能都在三维空间中进行直线运作。对你来说这一切轻而易举,因为在你脑中负责处理这些的“软件”已经很完美了。同样的,软件很难识别网站的验证码,不是因为软件太蠢,恰恰相反,是因为能够读懂验证码是件碉堡了的事情。
同样的,大数相乘、下棋等等,对于生物来说是很新的技能,我们还没有几亿年的世界来进化这些能力,所以电脑很轻易的就击败了我们。试想一下,如果让你写一个程序,是一个能做大数相乘的程序容易写,还是能够识别千千万万种字体和笔迹下书写的英文字母的程序难写?
比如看着下面这个图的时候,你和电脑都能识别出这是一个由两种颜色的小长方形组成的一个大长方形。
你和电脑打了个平手。接着我们把途中的黑色部分去除:
你可以轻易的描述图形中透明或不透明的圆柱和3D图形,但是电脑就看不出来了。电脑会描述出2D的阴影细节,但是人脑却能够把这些阴影所展现的深度、阴影混合、房屋灯光解读出来。
再看下面这张图,电脑看到的是黑白灰,我们看到的却是一块全黑的石头
**而且**,我们到现在谈的还是静态不变的信息。要想达到人类级别的智能,电脑必须要理解更高深的东西,比如微小的脸部表情变化,开心、放松、满足、满意、高兴这些类似情绪间的区别,以及为什么《布达佩斯大饭店》是好电影,而《富春山居图》是烂电影。
想想就很难吧?
我们要怎样才能达到这样的水平呢?
通往强人工智能的第一步:增加电脑处理速度
要达到强人工智能,肯定要满足的就是电脑硬件的运算能力。如果一个人工智能要像人脑一般聪明,它至少要能达到人脑的运算能力。
用来描述运算能力的单位叫作cps(calculationspersecond,每秒计算次数),要计算人脑的cps只要了解人脑中所有结构的最高cps,然后加起来就行了。
Kurzweil把对于一个结构的最大cps的专业估算,然后考虑这个结构占整个大脑的重量,做乘法,来得出人脑的cps。听起来不太靠谱,但是Kurzweil用了对于不同大脑区域的专业估算值,得出的最终结果都非常类似,是10^16cps,也就是1亿亿次计算每秒。
现在最快的超级计算机,中国的天河二号,其实已经超过这个运算力了,天河每秒能进行3.4亿亿。当然,天河二号占地720平方米,耗电2400万瓦,耗费了3.9亿美元建造。广泛应用就不提了,即使是大部分商业或者工业运用也是很贵的。
Kurzweil认为考虑电脑的发展程度的标杆是看1000美元能买到多少cps,当1000美元能买到人脑级别的1亿亿运算能力的时候,强人工智能可能就是生活的一部分了。
摩尔定律认为全世界的电脑运算能力每两年就翻一倍,这一定律有历史数据所支持,这同样表明电脑硬件的发展和人类发展一样是指数级别的。我们用这个定律来衡量1000美元什么时候能买到1亿亿cps。现在1000美元能买到10万亿cps,和摩尔定律的历史预测相符合。
也就是**说现在1000美元能买到的电脑已经强过了老鼠**,并且达到了人脑千分之一的水平。听起来还是弱爆了,但是,让我们考虑一下,1985年的时候,同样的钱只能买到人脑万亿分之一的cps,1995年变成了十亿分之一,2005年是百万分之一,而2015年已经是千分之一了。按照这个速度,我们到2025年就能花1000美元买到可以和人脑运算速度抗衡的电脑了。
至少在硬件上,我们已经能够强人工智能了(中国的天河二号),而且十年以内,我们就能以低廉的价格买到能够支持强人工智能的电脑硬件。
但是运算能力并不能让电脑变得智能,下一个问题是,我们怎样利用这份运算能力来达成人类水平的智能。
通往强人工智能的第二步:让电脑变得智能
这一步比较难搞。事实上,没人知道该怎么搞——我们还停留在争论怎么让电脑分辨《富春山居图》是部烂片的阶段。但是,现在有一些策略,有可能会有效。下面是最常见的三种策略:
## **1.抄袭人脑**
就好像你班上有一个学霸。你不知道为什么学霸那么聪明,为什么考试每次都满分。虽然你也很努力的学习,但是你就是考的没有学霸好。最后你决定“老子不干了,我直接抄他的考试答案好了。”这种“抄袭”是有道理的,我们想要建造一个超级复杂的电脑,但是我们有人脑这个范本可以参考呀。
科学界正在努力逆向工程人脑,来理解生物进化是怎么造出这么个神奇的东西的,乐观的估计是我们在2030年之前能够完成这个任务。一旦这个成就达成,我们就能知道为什么人脑能够如此高效、快速的运行,并且能从中获得灵感来进行创新。一个电脑架构模拟人脑的例子就是人工神经网络。它是一个由晶体管作为“神经”组成的网络,晶体管和其它晶体管互相连接,有自己的输入、输出系统,而且什么都不知道——就像一个婴儿的大脑。接着它会通过做任务来自我学习,比如识别笔迹。最开始它的神经处理和猜测会是随机的,但是当它得到正确的回馈后,相关晶体管之间的连接就会被加强;如果它得到错误的回馈,连接就会变弱。经过一段时间的测试和回馈后,这个网络自身就会组成一个智能的神经路径,而处理这项任务的能力也得到了优化。人脑的学习是类似的过程,不过比这复杂一点,随着我们对大脑研究的深入,我们将会发现更好的组建神经连接的方法。
更加极端的“抄袭”方式是“整脑模拟”。具体来说就是把人脑切成很薄的片,用软件来准确的组建一个3D模型,然后把这个模型装在强力的电脑上。如果能做成,这台电脑就能做所有人脑能做的事情——只要让它学习和吸收信息就好了。如果做这事情的工程师够厉害的话,他们模拟出来的人脑甚至会有原本人脑的人格和记忆,电脑模拟出的人脑就会像原本的人脑一样——这就是非常符合人类标准的强人工智能,然后我们就能把它改造成一个更加厉害的超人工智能了。
我们离整脑模拟还有多远呢?至今为止,我们刚刚能够模拟1毫米长的扁虫的大脑,**这**个大脑含有302个神经元。人类的大脑有1000亿个神经元,听起来还差很远。但是要记住指数增长的威力——我们已经能模拟小虫子的大脑了,蚂蚁的大脑也不远了,接着就是老鼠的大脑,到那时模拟人类大脑就不是那么不现实的事情了。
## **2.模仿生物演化**
抄学霸的答案当然是一种方法,但是如果学霸的答案太难抄了呢?那我们能不能学一下学霸备考的方法?
首先我们很确定的知道,建造一个和人脑一样强大的电脑是可能的——我们的大脑就是证据。如果大脑太难完全模拟,那么我们可以模拟演化出大脑的过程。事实上,就算我们真的能完全模拟大脑,结果也就好像照抄鸟类翅膀的拍动来造飞机一样——很多时候最好的设计机器的方式并不是照抄生物设计。
所以我们可不可以用模拟演化的方式来造强人工智能呢?这种方法叫作“基因算法”,它大概是这样的:建立一个反复运作的表现/评价过程,就好像生物通过生存这种方式来表现,并且以能否生养后代为评价一样。一组电脑将执行各种任务,最成功的将会“繁殖”,把各自的程序融合,产生新的电脑,而不成功的将会被剔除。经过多次的反复后。这个自然选择的过程将产生越来越强大的电脑。而这个方法的难点是建立一个自动化的评价和繁殖过程,使得整个流程能够自己运行。
这个方法的缺点也是很明显的,演化需要经过几十亿年的时间,而我们却只想花几十年时间。
但是比起自然演化来说,我们有很多优势。首先,自然演化是没有预知能力的,它是随机的——它产生的没用的变异比有用的变异多很多,但是人工模拟的演化可以控制过程,使其着重于有益的变化。其次,自然演化是没有目标的,自然演化出的智能也不是它目标,特定环境甚至对于更高的智能是不利的(因为高等智能消耗很多能源)。但是我们可以指挥演化的过程超更高智能的方向发展。再次,要产生智能,自然演化要先产生其它的附件,比如改良细胞产生能量的方法,但是我们完全可以用电力来代替这额外的负担。所以,人类主导的演化会比自然快很多很多,但是我们依然不清楚这些优势是否能使模拟演化成为可行的策略。
## **3.让电脑来解决这些问题**
如果抄学霸的答案和模拟学霸备考的方法都走不通,那就干脆让考题自己解答自己吧。这种想法很无厘头,确实最有希望的一种。
总的思路是我们建造一个能进行两项任务的电脑——研究人工智能和修改自己的代码。这样它就不只能改进自己的架构了,我们直接把电脑变成了电脑科学家,提高电脑的智能就变成了电脑自己的任务。
以上这些都会很快发生
**硬件的快速发展和软件的创新是同时发生**的,强人工智能可能比我们预期的更早降临,因为:
1)指数级增长的开端可能像蜗牛漫步,但是后期会跑的非常快;
2)软件的发展可能看起来很缓慢,但是一次顿悟,就能永远改变进步的速度。就好像在人类还信奉地心说的时候,科学家们没法计算宇宙的运作方式,但是日心说的发现让一切变得容易很多。创造一个能自我改进的电脑来说,对我们来说还很远,但是可能一个无意的变动,就能让现在的系统变得强大千倍,从而开启朝人类级别智能的冲刺。
**强人工智能到超人工智能之路**
总有一天,我们会造出和人类智能相当的强人工智能电脑,然后人类和电脑就会平等快乐的生活在一起。
呵呵,逗你呢。
即使是一个和人类智能完全一样,运算速度完全一样的强人工智能,也比人类有很多优势:
**硬件上:**
速度。脑神经元的运算速度最多是200赫兹,今天的微处理器就能以2G赫兹,也就是神经元1000万倍的速度运行,而这比我们达成强人工智能需要的硬件还差远了。大脑的内部信息传播速度是每秒120米,电脑的信息传播速度是光速,差了好几个数量级。
容量和储存空间。人脑就那么大,后天没法把它变得更大,就算真的把它变得很大,每秒120米的信息传播速度也会成为巨大的瓶颈。电脑的物理大小可以非常随意,使得电脑能运用更多的硬件,更大的内存,长期有效的存储介质,不但容量大而且比人脑更准确。
可靠性和持久性。电脑的存储不但更加准确,而且晶体管比神经元更加精确,也更不容易萎缩(真的坏了也很好修)。人脑还很容易疲劳,但是电脑可以24小时不停的以峰值速度运作。
**软件上来说:**
可编辑性,升级性,以及更多的可能性。和人脑不同,电脑软件可以进行更多的升级和修正,并且很容易做测试。电脑的升级可以加强人脑比较弱势的领域——人脑的视觉元件很发达,但是工程元件就挺弱的。而电脑不但能在视觉元件上匹敌人类,在工程元件上也一样可以加强和优化。
集体能力。人类在集体智能上可以碾压所有的物种。从早期的语言和大型社区的形成,到文字和印刷的发明,再到互联网的普及。人类的集体智能是我们统治其它物种的重要原因之一。而电脑在这方面比我们要强的很多,一个运行特定程序的人工智能网络能够经常在全球范围内自我同步,这样一台电脑学到的东西会立刻被其它所有电脑学得。而且电脑集群可以共同执行同一个任务,因为异见、动力、自利这些人类特有的东西未必会出现在电脑身上。
通过自我改进来达成强人工智能的人工智能,会把“人类水平的智能”当作一个重要的里程碑,但是**也就仅此而已了。它不会停留在这个里程碑上的。考虑到**强人工智能之于人脑的种种优势,人工智能只会在“人类水平”这个节点做短暂的停留,然后就会开始大踏步向超人类级别的智能走去。
这一切发生的时候我们很可能被吓尿,因为从我们的角度来看a)虽然动物的智能有区别,但是动物智能的共同特点是比人类低很多;b)我们眼中最聪明的人类要比最愚笨的人类要聪明很很很很多。
所以,当人工智能开始朝人类级别智能靠近时,我们看到的是它逐渐变得更加智能,就好像一个动物一般。然后,它突然达到了最愚笨的人类的程度,我们到时也许会感慨:“看这个人工智能就跟个脑残人类一样聪明,真可爱。”
但问题是,从智能的大局来看,人和人的智能的差别,比如从最愚笨的人类到爱因斯坦的差距,其实是不大的。所以当人工智能达到了脑残级别的智能后,它会很快变得比爱因斯坦更加聪明:
之后呢?
## **智能爆炸**
从这边开始,这个话题要变得有点吓人了。我在这里要提醒大家,以下所说的都是大实话——是一大群受人尊敬的思想家和科学家关于未来的诚实的预测。你在下面读到什么离谱的东西的时候,要记得这些东西是比你我都聪明很多的人想出来的。
像上面所说的,我们当下用来达成强人工智能的模型大多数都依靠人工智能的自我改进。但是一旦它达到了强人工智能,即使算上那一小部分不是通过自我改进来达成强人工智能的系统,也会聪明到能够开始自我改进。
这里我们要引出一个沉重的概念——递归的自我改进。这个概念是这样的:一个运行在特定智能水平的人工智能,比如说脑残人类水平,有自我改进的机制。当它完成一次自我改进后,它比原来更加聪明了,我们假设它到了爱因斯坦水平。而这个时候它继续进行自我改进,然而现在它有了爱因斯坦水平的智能,所以这次改进会比上面一次更加容易,效果也更好。第二次的改进使得他比爱因斯坦还要聪明很多,让它接下来的改进进步更加明显。如此反复,这个强人工智能的智能水平越长越快,直到它达到了超人工智能的水平——这就是智能爆炸,也是加速回报定律的终极表现。
现在关于人工智能什么时候能达到人类普遍智能水平还有争议。对于数百位科学家的问卷调查显示他们认为强人工智能出现的中位年份是2040年——距今只有25年。这听起来可能没什么,但是要记住,很多这个领域的思想家认为从强人工智能到超人工智能的转化会快得多。以下的情景很可能会发生:一个人工智能系统花了几十年时间到达了人类脑残智能的水平,而当这个节点发生的时候,电脑对于世界的感知大概和一个四岁小孩一般;而在这节点后一个小时,电脑立马推导出了统一广义相对论和量子力学的物理学理论;而在这之后一个半小时,这个强人工智能变成了超人工智能,智能达到了普通人类的17万倍。
这个级别的超级智能不是我们能够理解的,就好像蜜蜂不会理解凯恩斯经济学一样。在我们的语言中,我们把130的智商叫作聪明,把85的智商叫作笨,但是我们不知道怎么形容12952的智商,人类语言中根本没这个概念。
但是我们知道的是,人类对于地球的统治教给我们一个道理——智能就是力量。也就是说,一个超人工智能,一旦被创造出来,将是地球有史以来最强大的东西,而所有生物,包括人类,都只能屈居其下——而这一切,有可能在未来几十年就发生。
想一下,如果我们的大脑能够发明Wifi,那么一个比我们聪明100倍、1000倍、甚至10亿倍的大脑说不定能够随时随地操纵这个世界所有原子的位置。那些在我们看来超自然的,只属于全能的上帝的能力,对于一个超人工智能来说可能就像按一下电灯开关那么简单。防止人类衰老,治疗各种不治之症,解决世界饥荒,甚至让人类永生,或者操纵气候来保护地球未来的什么,这一切都将变得可能。同样可能的是地球上所有生命的终结。
当一个超人工智能出生的时候,对我们来说就像一个全能的上帝降临地球一般。
这时候我们所关心的就是
# 昨晚,媳妇让我给她讲AI!
> 来源:[https://aigcreative.feishu.cn/docx/KneudAkpho2ihuxK9nWcilWenIe](https://aigcreative.feishu.cn/docx/KneudAkpho2ihuxK9nWcilWenIe)
> 作者: 轩辕之风O 公众号:轩辕的编程宇宙
> 链接:https://mp.weixin.qq.com/s/BGT32Xo2yDzoyjwm8VaLPQ
大家好,我是轩辕。
昨天晚上我发了一条朋友圈,获得了很多小伙伴的点赞:
朋友圈的这张照片是这个:
最近AI实在太火了,作为产品经理的媳妇也想要学习人工智能背后的原理,一直让我给她科普一下,我几年前因为工作的原因需要用到AI,所以学过一些,于是我在家里的白板上给她“上了一课”。
人工智能技术发展非常快,前几年还是各种卷积神经网络的天下,现在网上最新的资讯全是Transformer了。
其实有很多人都有学习AI的需求,但他们学习只是想学习它的基础原理,不是要学了做开发。而网上的很多学习资料,一上来就给你讲一堆的数学知识,真的容易劝退人。
于是我想尝试用一些简单的语言化繁为简,用我之前的故事形式,写一些基础的科普性文章。今天是我之前写过的一篇,大家如果觉得还可以,欢迎点赞评论转发,如果反响还不错,后续我再继续更下去。
以下是正文内容:
## **我是一个AI神经元**
我是一个AI神经元,刚刚来到这个世界上,一切对我来说都特别新奇。
之所以叫这个名字,是因为我的工作有点像人类身体中的神经元。
人体中的神经元可以传递生物信号,给它输入一个信号,它经过处理后再输出一个信号传递给别的神经元,最终传递到大脑完成对一个信号的决策和处理。
**聪明的计算**机科学家们受到启发,在代码程序里发明了我:神经元函数。
在我们的世界里,我只是普普通通的一员,像我这样**的**神经元有成百上千,甚至上**万个,我**们按照层的形式,组成了一个庞大的神经网络。
很快我和隔壁工位的大白开始混熟了,他比我来得早,对这里要熟悉的多。
听大白告诉我说,我们这个神经网络是一个图像识别的AI程序,只要给我们输入一张狗的照片,我们就能告诉你这是一只柯基,还是泰迪、柴犬、二哈···
## **神经元结构**
在大白的指引下,我很快就学会了怎么工作。
虽然我们叫神经元,名字听起来挺神秘的,但实际上我就是一个普通函数,有参数,有返回值,普通函数有的我都有:
def neuron(a):
w = […]
b = …
…
我有一个参数**a**,**这个**参数是一个数组,里面的每一个元素我把它分别叫做a1,a2,a3···用这个a来模拟我这个神经元收到的一组信号。
人**类的**神经元是怎么处理输**入的生物**信号我不知道,我估计挺复杂的。但在我这里就很简单:我给每一个输入值设定一定的权重,然后做一个简单的加权求和,最后再加上一个偏移值就行啦!
所以我还有一个数组叫做**w**,就是权重**weight**的意思,里面的每一个元素我叫做w1,**w2,w**3···,至于那个偏移值,就叫它bias。
如此一来我的工作你们也该猜到了,就是把传进来的a里面的每个元素和w里的每一个元素做乘法,再加起来,最后加上偏移值,就像这样:
说到这里,我突然想到一个问题,打算去问问大白。
“大白,这些要计算的数据都是从哪里来的呢?”
“是上一层的神经元们送过来的”
“那他们的数据又是哪来的呢?”,我刨根问题的问到。
大白带我来到了门口,指向另外一个片区说到,“看到了吗?那里是数据预处理部门,他们负责把输入的图片中的像素颜色信息提取出来,交给我们神经网络部门来进行分析。”
“交给我们?然后呢”
“咱们这个神经网络就像一台精密的机器,我们俩只是其中两个零件,不同的权重值某种意义上代表了对图片上不同位置的像素关心程度。一旦开动起来,喂给我们图片数据,我们每一个神经元就开始忙活起来,一层层接力,把最终的结果输出到分类器,最终识别出狗的品种。”
## **神经网络训练**
正聊着,突然,传来一阵广播提示音,大家都停止了闲聊,回到了各自工位。
“这是要干啥,这么大阵仗?”,我问大白。
“快坐下,马上要开始训练了”,大白说到。
“训练?训练什么?”
“咱们用到的那些权重值和偏移值你以为怎么来的?就是通过不断的训练得出来的。”
还没说到几句话,数据就开始送过来了。按照之前大白教给我的,我将输入数据分别乘以各自的权重,然后相加,最后再加上偏移bias,就得到了最后的结果,整个过程很轻松。
我准备把计算结果交给下一层的神经元。
大白见状赶紧制止了我,“等一下!你不能直接交出去”
“还要干嘛?”
**大白指了**一下我背后的另一个家伙说到:“那是激活函数,得先交给他处理一下”
“激活函数是干嘛的?”,我问大白。
“**激活**,就是根据输入信号量的大小去**激活**产生对应大小的输出信号。这是在模仿人类的神经元对神经信号的反应程度大小,好比拿一根针去刺皮肤,随着力道的加大,身体的疼痛感会慢慢增强,差不多是一个道理。”
听完大白的解释,我点了点头,好像明白了,又好像不太明白。
后来我才知道,这激活函数还有好几种,经常会打交道的有这么几个:
+ sigmoid
+ tanh
+ relu
+ leaky relu
激活函数处理完后,总算可以交给下一层的神经元了,我准备稍事休息一下。
刚坐下,就听到大厅的广播:
随后,又来了一组新的数据,看来我是没时间休息了,赶紧再次忙活了起来。
这一忙不要紧,一直搞了好几个小时,来来回回重复工作了几万次,我都快累瘫了。
## **损失函数 & 优化方法**
趁着休息的空当,我又和大白聊了起来。
“大白,刚刚咱们这么来来回回折腾了几万次,这是在干啥啊?”
**大白也累的上气不接下气,缓了缓才说到:“这叫做网络训练,通过让我们分析大量不同品种狗的图**片,让我们训练出合适的权重和偏移值,这样,我们就变得会认识狗品种了,以后正式工作的时候给我们新的狗的图片,咱们也能用学到的知识去分辨啦!”
“那到底是怎么训练的,你给我说说呗”,我继续问到。
“你刚才也看到了,广播里不断通知更新权重和偏移值。这训练就是通过不断的尝试修改每一层神经元的权重值和偏移值,来不断优化,找到最合适的数值,让我们对狗的种类识别准确率最好!”,大白说到。
“不断尝试修改?这么多神经元,难不成看运气瞎碰?”
大白给了我一个白眼,“怎么可能瞎试,那得试到猴年马月去了。咱们这叫深度学习神经网络,是能够自学习的!”
他这么一说我更疑惑了,“怎么个学习法呢?”
“其实很简单,咱们先选一组权重偏移值,做一轮图片识别,然后看识别结果和实际结果之间的差距有多少,把差距反馈给咱们后,再不断调整权重和偏移,让这个差距不断缩小,直到差距接近于0,这样咱们的识别准确率就越接近100%”
“额,听上去好像很简单,不过我还有好多问题啊。怎么去衡量这个差距呢?具体怎么调整权重偏移呢?调整幅度该多大好呢?”,我小小的脑袋一下冒出了许多的问号。
大白脸上露出了不可思议的表情,“小伙子,不错嘛!你一下问出了神经网络的三个核心概念。”
“是哪三个?快给我说说”
大白喝了口水,顿了顿接着说到,“首先,怎么去衡量这个差距?**这个活,**咱们部门有个人专门干这活,他就是损失函数,他就是专门来量化咱们的输出结果和实际结果之间的差距。量化的办法有很多种,你空了可以去找他聊聊”
“那第二个呢?”
**“第二个**,具体怎么调整,这也涉及到咱**们神经网**络中一个核心概念,他就是优化方法,咱们部门用的最多的是一个叫梯度下降的方法。那玩意儿有点复杂,一时半会儿给你说不清楚,大概差不多就是用求导数的方式寻找如何让损失函数的损失值变小”,大白继续耐心的解释着。
“好吧,那第三个核心概念是什么?”
“你刚不是问调整幅度吗?这个调整幅度太小了不行,这样咱们训练的太慢了,那得多训练很多**回。**太大了也不行,**要是一不**小心错过了那个最优值,损失函数的结果就会来回摇摆,不能收敛,所以有一个叫学习速率的数值,通常需要程序员们凭借经验去设定”
我还沉浸在大白的讲解中,广播声再次响起:
看来程序员修改了学习速率,我只好打起精神,继续去忙了,真不知道何时才能训练达标啊~
# 从单一模型到复合人工智能系统的转变
> 来源:[https://aigcreative.feishu.cn/docx/GMfTdLXheokGM1x1tWDcPR7pnkd](https://aigcreative.feishu.cn/docx/GMfTdLXheokGM1x1tWDcPR7pnkd)
> 来源:https://bair.berkeley.edu/blog/2024/02/18/compound-ai-systems/
> 翻译:创意猎人
2023** 年,人工智能凭借大型语言模型 (LLM**) 引起了所有人的关注,只需提示即可指示该模型执行一般任务,例如翻译或编码。这自然导致了人们对模型作为人工智能应用程序开发主要成分的强烈关注,每个人都想知道新的法学硕士将带来什么能力。然而,随着越来越多的开发人员开始使用法学硕士进行构建,我们相信这种关注点正在迅速发生变化:最先进的人工智能结果越来越多地通过具有多个组件的复合系统获得,而不仅仅是单一模型。
例如,Google 的[AlphaCode 2](https://storage.googleapis.com/deepmind-media/AlphaCode2/AlphaCode2_Tech_Report.pdf)通过精心设计的系统在编程方面取得了最先进的结果,该系统使用法学硕士[为一项任务生成多达 100](https://deepmind.google/discover/blog/alphageometry-an-olympiad-level-ai-system-for-geometry/) 万个可能的解决方案,然后筛选出该组解决方案。同样, AlphaG[eometry将法学硕士](https://arxiv.org/pdf/2005.11401.pdf)与传统的符号求解器相结合来解决奥林匹克问题。在企业中,我们 Databri[ck](https://www.microsoft.com/en-us/research/blog/the-power-of-prompting/)s 的同事发现 60% 的 LLM 应用程序使用某种形式的检索增强生成 (RAG),30% 使用多步骤链。即使是从事传统语言模型任务的研究人员,他们过去只报告一次 LLM 调用的结果,现在也报告来自日益复杂的推理策略的结果:微软写了一篇链接策略,该策略比 GPT-4 在医学检查中的准确性高出 9%,并且Google 的 Gemini 发布帖子使用新的 CoT@32 推理策略测量了 MMLU 基准测试结果,该策略调用该模型 32 次,这引发了对其与仅一次调用 GPT-4 的比较的质疑。这种向复合系统的转变带来了许多有趣的设计问题,但也令人兴奋,因为这意味着领先的人工智能成果可以通过巧妙的工程来实现,而不仅仅是扩大培训规模。
在这篇文章中,我们分析了复合人工智能系统的趋势及其对人工智能开发人员的意义。为什么开发人员要构建复合系统?随着模型的改进,这种范式会继续存在吗?用于开发和优化此类系统的新兴工具是什么(该领域的研究远少于模型训练)?我们认为,复合人工智能系统可能是未来最大化人工智能成果的最佳方式,并且可能是 2024 年人工智能最有影响力的趋势之一。
越来越多的新人工智能成果来自复合系统。
# **为什么要使用复合人工智能系统?**
我[们将复合](https://en.wikipedia.org/wiki/Statistical_model)人工智能系统定义为使用多个交互组件(包括对模型、检索器或外部工具的多次调用)处理人工智能任务的系统。相比之下,AI 模型只是一个统计模型,例如预测文本中下一个标记的 Transformer。
尽管人工智能模型不断变得更好,并且其扩展还没有明显的终点,但使用复合系统获得了越来越多的最先进的结果。这是为什么?我们看到了几个不同的原因:
1. 有些任务更容易通过系统设计[来改进。](https://arxiv.org/pdf/2001.08361.pdf)虽然法学[硕士似乎遵循显着的](https://storage.googleapis.com/deepmind-media/AlphaCode2/AlphaCode2_Tech_Report.pdf)缩放法则,可以预见,通过更多的计算可以产生更好的结果,但在许多应用中,缩放提供的回报与成本比构建复合系统更低。例如,假设当前最好的 LLM 可以在 30% 的时间内解决编码竞赛问题,将其培训预算增加三倍将使该数字增加到 35%;这仍然不够可靠,不足以赢得编码比赛!相比之下,设计一个从模型中多次采样、测试每个样本等的系统可能会将当今模型的性能提高到 80%,如AlphaCode等工作所示。更重要的是,迭代系统设计通常比等待训练运行要快得多。我们相信,在任何高价值应用中,开发人员都会希望使用所有可用的工具来最大限度地提高人工智能质量,因此除了扩展之外,他们还会使用系统思想。我们经常在法学硕士用户身上看到这种情况,一个好的法学硕士会创建一个引人注目但令人沮丧的不可靠的第一个演示,然后工程团队继续系统地提高质量。
1. **系统可以是动态的。**机器学习模型本质上是有限的,因为它们是在静态数据集上进行训练的,因此它们的“知识”是固定的。因此,开发人员需要将模型与其他组件(例如搜索和检索)结合起来,以合并及时的数据。此外,训练让模型“看到”整个训练集,因此需要更复杂的系统来构建具有访问控制的人工智能应用程序(例如,仅根据用户有权访问的文件回答用户的问题)。
1. 使用系[统可以更轻松](https://arxiv.org/pdf/2305.14292.pdf)地改善控制和信任。神经网络模型本身很难控制:虽然训练会影响它们,但几乎不可能保证模型会避免某些行为。使用人工智能系统而不是模型可以帮助开发人员更严格地控制行为,例如通过过滤模型输出。同样,即使是最好的法学硕士仍然会产生幻觉,但将法学硕士与检索相结合的系统可以通过提供引文或自动验证事实来增加用户信任。
1. **绩效目标差异很大。**每个人工智能模型都有固定的质量水平和成本,但应用程序通常需要改变这些参数。在某些应用程序中,例如内联代码建议,最好的 AI 模型太昂贵,因此 Github Copilot 等工具使用精心调整的较小模型和各种搜索启发式方法来提供结果。在其他应用中,即使是最大的模型,如 GPT-4,也太便宜了!许多用户愿意支付几美元来获得正确的法律意见,而不是花几美分来询问 GPT-4,但开发人员需要设计一个 AI 系统来利用这一更大的预算。
生[成式](https://maithraraghu.com/blog/2023/does-one-model-rule-them-all/)人工智能向复合系统的转变也符合其他人工智能领域的行业趋势,例如自动驾驶汽车:大多数最先进的实现都是具有多个专用组件的系统(更多讨论请参见此处)。出于这些原因,我们相信即使模型不断改进,复合人工智能系统仍将是领先的范例。
# **开发复合人工智能系统**
虽然复合人工智能系统可以提供明显的好处,但设计、优化和操作它们的艺术仍在不断涌现。从表面上看,人工智能系统是传统软件和人工智能模型的结合,但其中存在许多有趣的设计问题。例如,整体“控制逻辑”应该用传统代码(例如调用LLM的Python代码)编写,还是应该由AI模型驱动(例如调用外部工具的LLM代理)?同样,在复合系统中,开发人员应该在哪里投入资源——例如,在 RAG 管道中,是在检索器上还是在 LLM 上花费更多的 FLOPS,甚至多次调用 LLM 更好?最后,我们如何才能像训练神经网络一样,端到端地优化具有离散组件的人工智能系统以最大化指标?在本节中,我们将详细介绍一些人工智能系统示例,然后讨论这些挑战以及最近的研究。
## **人工智能系统设计空间**
以下是一些最近的复合人工智能系统,展示了设计选择的广度:
## **复合人工智能系统的主要挑战**
与人工智能模型相比,复合人工智能系统在设计、优化和操作方面提出了新的挑战。
### **设计空间**
针对给[定任](https://arxiv.org/pdf/2305.14292.pdf)务的可能系统设计范围非常广泛。例如,即使在具有检索器和语言模型的检索增强生成(RAG)的简单情况下,也有:(i)许多检索和语言模型可供选择,(ii)其他提高检索质量的技术,例如查询扩展或重新排序模型,以及 (iii) 改进 LLM 生成输出的技术(例如,运行另一个 LLM 以检查输出是否与检索到的段落相关)。开发人员必须探索这个广阔的空间才能找到好的设计。
此外,开发人员需要在系统组件之间分配有限的资源,例如延迟和成本预算。例如,如果您想在 100 毫秒内回答 RAG 问题,您应该预算在检索器上花费 20 毫秒,在 LLM 上花费 80 毫秒,还是反之亦然?
### **优化**
通常,在机器学习中,要最大限度地提高复合系统的质量,需要共同优化各个组件,使其能够很好地协同工作。例如,考虑一个简单的 RAG 应用程序,其中法学硕士看到用户问题,生成搜索查询发送给检索器,然后生成答案。理想情况下,LLM 将被调整为生成适合该特定检索器的查询,并且检索器将被调整为更适合该 LLM 的答案。
在 PyTorch 的单一模型开发中,用户可以轻松地端到端优化模型,因为整个模型是可微分的。然而,复合人工智能系统[包含不可](https://arxiv.org/pdf/2310.03714.pdf)[微分的组件](https://arxiv.org/pdf/2201.08239.pdf),[如搜索引擎或代码解释](https://arxiv.org/pdf/2302.04761.pdf)器[,因此需要新的优化方法。优](https://deepmind.google/discover/blog/alphageometry-an-olympiad-level-ai-system-for-geometry/)化这些复合人工智能系统仍然是一个新的研究领域;例如,DSPy为预训练的 LLM 和其他组件的管道提供通用优化器,而其他系统(如LaMDA、Toolformer和AlphaGeometry)在模型训练期间使用工具调用来优化这些工具的模型。
### **运营**
对于复合人工智能系统来说,机器学习操作 (MLOps) 变得更具挑战性。例如,虽然跟踪垃圾邮件分类器等传统 ML 模型的成功率很容易,但开发人员应如何跟踪和调试同一任务的 LLM 代理的性能,这可能会使用可变数量的“反射”步骤或外部 API 调用来对消息进行分类?我们相信新一代 MLOps 工具将会被开发出来来解决这些问题。有趣的问题包括:
+ **监控:**开发人员如何最有效地记录、分析和调试复杂人工智能系统的跟踪?
+ **DataOps:**由于许多人工智能系统涉及矢量数据库等数据服务组件,并且它们的行为取决于所服务数据的质量,因此对这些系统操作的任何关注都应该另外跨越数据管道。
+ **安全性:**研究表明,与单个模型相比,复合人工智能系统(例如带有内容[过滤器的 LLM ](https://arxiv.org/pdf/2309.05610.pdf)聊天机器人)可能会产生不可预见的安全风险。需要新的工具来保护这些系统。
## **新兴范式**
为了应对构建复合人工智能系统的挑战,行业和研究中出现了多种新方法。我们重点介绍了一些最广泛使用的方法以及我们应对这些挑战的研究中的示例。
### 设计人工智能系统:组合框架和策略。
许多开发人员现在使用[“语言模型编程”](https://www.twosigma.com/articles/a-guide-to-large-language-model-abstractions/)框架,使他们可以通过对人工智能模型和其他组件的多次调用来构建应[用程序。其中包括开](https://www.langchain.com/)发[人员从传统程序调用的](https://www.llamaindex.ai/)[LangCha](https://autogpt.net/)i[n和LlamaInd](https://www.guardrailsai.com/)e[x等组件库、让 ](https://outlines-dev.github.io/outlines/)L[LM 驱](https://lmql.ai/)动应用程序的AutoGPT和BabyAGI等代理框架,以及用于控制 LM 输出的工具,如Guardrails、Outlines、LMQL和SGLang。与此同时,研究人员正在开发许多新的推理策略,以便通过调用模型和工具(例如思想链、自我一致性、WikiChat、RAG等)来生成更好的输出。
### **自动优化质量:DSPy。**
[DSPy](https://arxiv.org/pdf/2310.03714.pdf)来自学术界,是第一个旨在优化由 LLM 调用和其他工具组成的系统以最大化目标指标的框架。用户通过对 LLM 和其他工具的调用编写应[用程序,并提供](https://pytorch.org/)目标指标,例如验证集的准确性,然后 DSPy 通过为每个模块创建提示指令、少量示例和其他参数选择来自动调整管道最大限度地提高端到端性能。效果类似于PyTorch中多层神经网络的端到端优化,只是 DSPy 中的模块并不总是可微层。为此,DSPy 以一种简洁的方式利用 LLM 的语言能力:为了指定每个模块,用户编写自然语言签名,例如user_question -> search_query,其中输入和输出字段的名称有意义,DSPy 会自动将其转换为合适的提示说明、少量示例,甚至是底层语言模型的权重更新。
### 优化成本:FrugalGPT 和 AI 网关。
可[用的人工智能模型和](https://arxiv.org/pdf/2305.05176.pdf)服务种类繁多,这使得为应用程序选择合适的模型和服务变得具有挑战性。此外,不同的模型可能在不同的输入上表现更好。FrugalGPT是一个框架,可自动将[输入路由到不同的 A](https://openrouter.ai/)I[ 模型级联,以](https://withmartian.com/)根据目标预算最大限度地提高质量。基于一小组示例,它学习了一种路由策略,该策略可以在相同成本下比最好的 LLM 服务高出多达 4%,或者在匹配其质量的同时将成本降低多达 90%。 FrugalGPT 是 AI 网关或路由器的更广泛新兴概念的一个示例,在Databricks AI Gateway、OpenRouter和Martian等软件中实现,以优化 AI 应用程序每个组件的性能。当人工智能任务在复合系统中被分解为更小的模块化步骤时,这些系统的工作效果会更好,并且网关可以为每个步骤单独优化路由。
### 操作:LLMOps 和 DataOps。
人工[智能应用程序始终需](https://www.langchain.com/langsmith)要[仔细监控模型输出和数据管道才](https://docs.arize.com/phoenix/quickstart/llm-traces)能可[靠运行。然而,对于复合人工智能](https://arxiv.org/pdf/2312.13382.pdf)系统,系统在每个输入上的行为可能要复杂得多,[因此跟踪应用程序](https://arxiv.org/pdf/2306.05685.pdf)和[中间输出](https://arxiv.org/pdf/2401.06855.pdf)所[采取的所有](https://arxiv.org/pdf/2311.09476.pdf)步骤非常重要。LangSmith、Phoenix Traces和Databricks Inference Tables等软件可以精细地跟踪、可视化和评估这些输出,在某些情况下还将它们与数据管道质量和下游指标相关联。在研究领域,DSPy Assertions寻求直接利用人工智能系统中的监控检查反馈来提高输出,而基于人工智能的质量评估方法(如MT-Bench、FAVA和ARES)旨在实现质量监控的自动化。
# **结论**
生成式人工智能通过自然语言提示解锁了广泛的功能,让每一位开发人员都兴奋不已。然而,随着开发人员的目标超越演示并最大限度地提高人工智能应用程序的质量,他们越来越多地转向复合人工智能系统,作为控制和增强法学硕士能力的自然方式。找出开发复合人工智能系统的最佳实践仍然是一个悬而未决的问题,但已经有令人兴奋的方法来帮助设计、端到端优化和操作。我们相信,复合人工智能系统仍将是最大限度提高人工智能应用质量和可靠性的最佳方式,并且可能是 2024 年人工智能最重要的趋势之一。
# 从神经网络到 Hugging Face,神经网络和深度learning简史
> 来源:[https://aigcreative.feishu.cn/docx/XBo0dzUe9o6I4IxJ0sfczKafnee](https://aigcreative.feishu.cn/docx/XBo0dzUe9o6I4IxJ0sfczKafnee)
> 来源:**胡涂说**
> 链接:https://hutusi.com/articles/the-history-of-neural-networks
从去年开始,我读了十余本人工智能方面入门的书籍(参见文末附2),酝酿了两个月,花了两周时间写作此文。本文简要回顾了从感知机到深度学习及Hugging Face的历史,并试图以通俗的语言来介绍神经网络和深度学习的原理。
> 生活中没有什么可怕的东西,只有需要理解的东西。
> —— 居里夫人
## **一 深度信念网络**
2006年,加拿大多伦多大学教授杰弗里·辛顿在研究如何训练多层神经网络,他已经在神经网络领域默默耕耘了三十多年,尽管在这个领域他算得上是泰斗级的人物,但由于神经网络在人工智能行业一直不被看好,所以他的研究成果一直不为业界所重视。
辛顿出生于英国伦敦,他的家族出过不少知名学者,创立布尔代数的逻辑学家乔治·布尔便是他的曾曾祖父。他的祖父是位科普作家,父亲是昆虫学家。辛顿比周围的人都要聪明,但他的求学之路却颇为曲折,先是在大学攻读建筑学,转而又选择物理学,后又改读哲学,最后以心理学学士身份毕业。1972年辛顿进入爱丁堡大学攻读博士学位,研究方向是神经网络。彼时神经网络被业界所鄙夷,连辛顿的导师也认为这玩意没什么实际用途,也没有前途可言。但辛顿却不为所动,对神经网络研究怀有信心,坚持认为能够证明神经网络的价值,这一坚持就是三十多年。
辛顿年轻的时候有一次搬移取暖器,腰椎间盘滑脱了,此后便一直饱受腰背病痛问题的困扰。近年来,问题更严重了,大多数时候,他需要平躺着以缓解疼痛,这意味着他不能开车,也不能坐飞机,甚至在实验室里会见学生时,也要平躺在办公室的折叠床上。身体上疼痛的折磨带给辛顿的打击还不如学术研究被冷漠那么大。早在1969年,明斯基在《感知机》一书中就对多层感知机下了定论,给后来的神经网络研究盖戳:“多层感知机不会有发展前景,因为世界上没人可以将多层感知机训练得足够好,哪怕是令它可以学会最简单的函数方法。” 单层感知机能力有限,连“异或”这种基础的分类问题也实现不了,而多层感知机又没有可用的训练方法,等于说神经网络的研究方向是死路一条。神经网络在业界被认为是学术异端,没有人相信它可以成功,因此一般学生在选择导师的时候都谨慎绕开神经网络,一时间辛顿甚至都招不满研究生。
1983年,辛顿发明玻尔兹曼机,后来,简化后的受限玻尔兹曼机被应用于机器学习,成为深度神经网络的层级结构基础。1986年,辛顿提出适用于多层感知机的误差反向传播算法(BP),这一算法奠定了后来深度学习的基础。辛顿每隔一段时间都能发明出新东西,而他也坚持写了两百多篇神经网络相关的论文,尽管这些论文不被待见。到了2006年,辛顿已经积累了丰富的理论和实践基础,而这一次,他发表的论文将改变整个机器学习乃至整个世界。
辛顿发现,拥有多个隐藏层的神经网络能够具有自动提取特征学习的能力,相比传统的手工提取特征的机器学习更有效果。另外,通过逐层预训练的方式可以降低多层神经网络的训练难度,而这解决了长期以来多层神经网络训练的难题。辛顿将他的研究成果发表在两篇论文中,而当时神经网络一词被许多学术期刊编辑所排斥,有些稿件的标题甚至因为包含“神经网络”就会被退回。为了不刺激这些人的敏感神经,辛顿取了个新名字,将该模型命名为“深度信念网络”(Deep Belief Network)。
## **二 感知机**
其实神经网络的研究可以追溯到上世纪四十年代。1940年,17岁的沃尔特·皮茨在伊利诺伊大学芝加哥分校结识了42岁的教授沃伦·麦卡洛克,一见如故,便加入了后者的研究项目:尝试用神经元网络建立一个在逻辑运算基础上的机械性的大脑思维模型。他们用逻辑运算来抽象人类大脑的思维模型,提出了“神经网络”(Neural Network)这一概念,而神经元是神经网络中的最小信息处理单元;并且他们将神经元的工作过程抽象简化成一个非常简单的逻辑运算模型,后来这个模型被命名为“M-P神经元模型”,以他们两姓名的首字母来命名。
在这个模型中,一个神经元会接受过个来自于其他神经元传递过来的输入信号,不同的输入信号的重要性有差异,这种差异就通过连接上的“权重”(weight)大小来表示,该神经元将所有输入值按照权重加权求和,再将结果跟神经元的“激发阈值”(Threshold)进行比较,以决定是否对外输出信号。
“M-P模型”足够简单直接,而且可以通过符号逻辑来模拟实现,人工智能专家以该模型为基础,构建了神经网络模型,用来解决机器学习任务。这里简单说明下人工智能、机器学习和深度学习的关系:人工智能就是使用计算机技术来实现人类智能的技术,在一般教材定义为研究与构建智能体。智能体就是 Intelligent agent,或简称 agent,它通过模仿人类思维和认知来解决特定任务或通用任务,解决特性任务的智能体被称为弱人工智能,或狭义人工智能(ANI),而解决通用任务的智能体被称为强人工智能,或通用人工智能(AGI)。机器学习是人工智能的一个分支,它通过数据进行学习并改进系统。而深度学习则又是机器学习的一个分支,它使用神经网络技术进行机器学习。
1957年,康奈尔大学心理学教授罗森布拉特在IBM计算机上模拟实现了一个神经网络模型,他称之为“感知机”(Perceptron)。他的做法是将一组M-P模型神经元组合在一起,可以用来训练并完成一些机器视觉模式识别方面的任务。一般来说,机器学习有两种任务:分类和回归。分类问题是判断数据是哪一类的问题,比如识别图像是猫还是狗;而回归问题是根据一个数据预测另一个数据的问题,比如根据人的图像预测其体重。感知机解决的是线性分类问题。以《智慧的疆界》书中对感知机工作原理的举例来解释:
假设任务目标是自动识别阿拉伯数字,待识别的数字是将手写或印刷的各种形式的数字,将数字通过扫描后存储在14*14像素大小的图片文件中。首先,要准备类似下图的训练集供机器学习用。训练集即训练数据集,是专门提供给计算机学习使用的数据集,它不仅是一组图片之类的数据,还会由人工事先标注告诉机器这些图片数据代表的数字是什么。
然后,我们要设计一种数据结构,以便机器可以存储并处理这些图片。对于14*14的灰度数字图片,可以将黑色像素用1来表示,白色像素用0表示,介于黑白间的灰度像素根据其灰度强度用0-1间的浮点数表示。如下图所示对该图可以转换成一个二维张量数组:
而机器能够识别出图片中的数字是什么,主要是找到了该图片表示某个数字的特征。对于人类来说,对于识别这些手写体数字很容易,但我们很难解释这些特征是什么。机器学习的目标就是要提取出这些训练集中图片表示数字的特征,根据M-P模型,提取特征的方法就是选择对图片各个像素值进行加权求和,根据训练集中的样本图片和标注数据的对应结果来计算每个像素对应各数字的权值:如果某一个像素具有很负面的证据说明该图片不属于某个数字的话,就把该像素对应该数字的权值设置成负数,相反如果一个像素具有很正面的证据说明该图片属于某个数字,那么该像素对应该数字的权值设置成正值。比如对于数字“0”的图片中间点的像素不应该有黑色(1)像素,如果出现了则表明该图片属于数字0为负面证据,就降低该图片是数字0的概率。这样,经过对数据集的训练和校准,就可以得到14*14(=196)每个像素对应0-9各数字的权重分布。
我们再将每个数字的分类过程转换成一个M-P神经元,每个神经元都有196个像素输入,每个输入与该神经元之间的权重值由训练得到,这样就构成了一个10个神经元、196个输入以及它们之间1960个带权重的连接线组成的神经网络,如下图示:(一般在神经网络中,会将阈值转换成偏置bias,称为求和项的一项,简化运算过程。)
不过,在实际情况中,有些手写字体存在模棱两可的情况,可能会导致加权求和后,出现两个或两个以上的神经元被激活。因此感知机在实现时引入了激活函数的设计,如下图中的Softmax就是一种激活函数,该函数会对求和值进行处理,抑制概率小的、增强概率大的数字分类。
罗森布拉特又在两年后制造了世界第一台硬件感知机”Mark-1”,该感知机可以识别英文字母,在当时可是引起了巨大轰动。美国国防部和海军军方也注意到了,并给与了大量的资金支撑,罗森布拉特对感知机的自信也达到顶点,甚至有记者问“有没有感知机做不到的事情”,罗森布拉特的回答是“爱、希望、绝望”。罗森布拉特的名气越来越大,而张扬的性格也导致他四处树敌,其中最有名的是人工智能的另一位巨头马文·明斯基。明斯基是达特茅斯会议的组织者,也是人工智能的奠基者之一。1969年,他出版了《感知机》一书,该书明确指出了感知机存在的缺陷。首先是通过数学方法证明了感知机无法处理异或等非线性分类问题,而后又证明了多层感知机的复杂度导致连接数据急剧膨胀而没有合适的训练方法。明斯基在该书出版当年获得了第四届图灵奖,巨大的声望让他对感知机的判断给神经网络研究判了死刑。连接主义备受打击,而符号主义的研究则成为人工智能的主流。
人工智能领域有两大流派:连接主义和符号主义,有点像武侠小说中的剑宗和气宗,长期以来一直互相竞争。连接主义通过模拟人类的大脑构建神经网络,将知识存储在大量的连接中,基于数据学习来发展人工智能。而符号主义则是认为知识和推理都应该用符号和规则来表示,即大量的“if-then”规则定义,来产生决策和推理,基于规则和逻辑来发展人工智能。前者的代表是神经网络,后者的代表是专家系统。
## **三 深度学习**
随着感知机的失败,政府对人工智能领域的投入减少,人工智能进入了第一次寒冬期。而到了八十年代,以专家系统为代表的符号主义成为人工智能的主流,引发了人工智能的第二波浪潮,而神经网络研究被冷落。前文说到,只有一个人还在坚持,那就是杰弗里·辛顿。
辛顿在前人的基础上,先后发明了玻尔兹曼机和误差反向传播算法,辛顿在神经网络领域的开创贡献给这个领域带来了生机,虽然从上世纪八十年代到本世纪初人工智能领域的主流仍然是知识库和统计分析,神经网络的各项技术也开始突破,其中代表性的如卷积神经网络(CNN)、长短期记忆网络(LSTM)等。到了2006年,辛顿提出深度信念网络,开启了深度学习时代。
深度学习所对应的神经网络模型称为深度神经网络,这是相对浅层神经网络而言的。对于浅层神经网络而言,一般只有一个隐藏层(或称中间层),加上输入层和输出层,一共就三层。而深度神经网络的隐藏层则不止一层,对比两种神经网络:
深度学习之前人们一直聚焦于浅层神经网络的原因是神经网络层数的增加会导致训练难度增加,一方面缺乏足够的算力支撑,另一方面也没有很好的算法。而辛顿提出的深度信念网络则使用误差反向传播算法并通过逐层预训练的方式来解决这一训练难题。在深度信念网络之后,深度神经网络成为机器学习的主流模型,当前热门的GPT、Llama等大模型都是由一种或多种深度神经网络构建而成。
对于深度神经网络的理解可以参考上文感知机原理的介绍,将深度神经网络看成是多层多个神经元的组合,由前文可以了解,每一层输出结果跟权重、偏置和激活函数有关,而对于深度神经网络的输出还跟层数等数值相关。在深度神经网络中,这些数值可以分为两类,一类是层数、激活函数、优化器等,称为超参数(hyperparameter),它由工程师设定;另一类是权重和偏置,称为参数(parameter),它是在深度神经网络训练过程中自动得到的,寻找到合适的参数就是深度学习的目的。
但问题是,一个深度神经网络包含了海量的参数,而且修改一个参数将影响其他的参数行为,因此如何找到这些参数的正确取值是个难事。我们要找出参数正确取值,并让模型能够准确输出,那就需要有一个方法能够衡量模型输出与期望输出的差距。因此深度学习训练中使用损失函数(loss function)来衡量,损失函数也被称为目标函数或代价函数。损失函数通过比较深度神经网络的预测值与真实目标值,得到损失值,来表示该神经网络模型在这个训练样本上的效果好坏。
深度学习的方法是将损失值作为反馈信号,来对参数进行微调,以降低当前样本训练的损失值。实现这种调节的便是优化器,它来实现如梯度下降等优化算法,通过反向传播方式来更新各层神经元节点的参数。
一开始会对神经网络的参数进行随机赋值,输入一批训练数据,经输入层、隐藏层到输出层,得到网络的预测输出后,根据损失函数计算损失值,这是前向传播过程;然后从输出层开始,反向沿着每一层计算参数的梯度,直到输入层,并根据梯度使用优化算法更新网络的参数,这是反向传播过程。神经网络每处理一批训练样本,参数都会向正确的方向微调,损失值也会减小,这就是训练循环。训练循环足够次数,就可以得到使损失函数最小化的参数,这样就可以得到一个好的神经网络模型。
当然,实际的深度学习过程比这个要复杂得多,这里只是简要介绍下大概过程。
2012年时,辛顿带领他的两名学生 Alex Krizhevsky 和 Ilya Sutskever,开发了AlexNet 神经网络,参加 ImageNet 图像识别大赛,结果获得冠军,准确率远远高出第二名。随后辛顿和他的学生成立了DNNResearch公司,专注于深度神经网络的研究。这家公司没有任何产品或资产,但 AlexNet 的成功吸引了几大互联网巨头。2012年冬天,在美国加州和内华达州交界的太浩湖边,一场秘密的竞拍正在进行:被拍卖的对象是刚成立不久的DNNResearch,买家分别是谷歌、微软、DeepMind和百度。最后在谷歌和百度还在竞相抬价时,辛顿叫停了拍卖,选择以4400万美元卖给谷歌。2014年,谷歌又将DeepMind收入囊中。2016年,采用经典蒙特卡洛树搜索和深度神经网络结合的AlphaGo战胜了李世石,次年,又战胜了世界围棋排名第一的柯洁,AlphaGo将人工智能和深度学习推向了一个新的高潮。
## **四 大模型**
2015年,马斯克、Stripe的CTO Greg Brockman、YC创投CEO Sam Altman 和 Ilya Sutskever等人在加州的Resewood酒店里会面,商议创建一家人工智能实验室,以对抗大型互联网公司对人工智能技术的控制。接下来,Greg Brockman 又从谷歌、微软等公司邀请来一批研究人员,成立新的实验室,并命名为OpenAI。Greg Brockman、Sam Altman 和 Ilya Sutskever 分别担任 OpenAI的董事长、CEO 和 首席科学家。
马斯克和 Sam Altman 对 OpenAI 最初的设想是非营利组织,将人工智能技术面向所有人开放,以此对抗大型互联网公司控制人工智能技术而带来的危险性。因为深度学习人工智能技术正在爆炸式的发展,谁也预料不到这项技术在未来会不会形成对人类的威胁,而开放可能是最好的应对方式。而后来2019年OpenAI为了融资发展技术而选择成立盈利子公司,并闭源其核心技术,这是后话。
2017年,谷歌的工程师发表了一篇论文,名为《Attention is all you need》,在这篇论文中提出了 Transformer 神经网络架构,该架构的特点是将人类的注意力机制引入到了神经网络中。前文说到的图像识别是深度学习中的一种场景,图像数据是离散数据,之间没有关联。而现实生活中还有另外一种场景,就是处理时序型数据,比如文本,文字的上下文是有关联的,还有语音、视频等,都是时序型数据。这种时序型数据叫序列(sequence),并且实际任务中往往是将一个序列转换成另外一个序列,比如翻译,将一段中文翻译成一段英文,还有机器人问答,将一段问题转换成一段智能生成的回答,因此要用到转换器(Transformer),这也是Transformer 名称的由来。前文说到,一个神经元的激发是由它连接的输入数据加权和决定的,权重代表了连接的强度。在时序数据中,每个元素的权重也是不一样的,这跟我们日常生活的经验是一致的,比如看下面这段话:
> 研表究明,汉字的序顺并不定一能影阅响读,比如当你完看这句话后,才发这现里的字全是都乱的。
不仅是汉字,英语等其他人类语言同样如此。这是因为我们的大脑会自动判断句子里字词的权重,在冗杂的信息里抓中重点,这就是注意力Attention。谷歌工程师将注意力机制引入到神经网络模型中,用于自然语言处理,使得机器可以“理解”人类语言的意图。随后2018年,OpenAI基于Transformer架构发布了GPT-1,2019年发布GPT-2,2020年发布GPT-3,2022年底基于GPT-3.5发布了ChatGPT人工智能问答程序,它的对话能力让人震惊,人工智能也向着AGI方向迈进了一大步。
GPT全称是 Generative Pre-trained Transformer, Generative 生成式表明它的能力,能够生成新内容,Transformer 是它的基础架构,而中间的 Pre-trained 表明它的训练方式是预训练。为什么叫预训练呢?这是因为,从AlexNet开始,人们为了取得更好的效果,在神经网络训练中开始采用更大的数据和更多的参数,而这也意味着训练的资源和耗时也越来越大。这种成本对于训练特定任务有些高,且不能与其他神经网络共享,有些浪费。因此,业界开始采用一种预训练+微调的方式来训练神经网络模型,即先在较大的数据集上完成通用大模型的训练,然后在具体的任务场景用较小的数据集完成模型微调。ChatGPT采用了基于人类反馈的强化学习(Reinforcement learning from human feedback, RLHF)来进行预训练微调,分成三个步骤:第一步,预训练一个语言模型(LM);第二步,收集问答数据并训练一个奖励模型(Reward Model,RM);第三步,用强化学习(RL)方式微调语言模型(LM)。这个奖励模型包含了人工反馈,因此训练过程称为RLHF。
用户在使用ChatGPT过程中,除了赞叹它的准确度外,还被多轮对话的能力所折服。根据神经网络的底层探析,我们看到每次推理过程是从输入经各神经元加权和激活到输出,是没有记忆能力的。而ChatGPT之所以多轮对话效果好,是因为它在对话管理中使用了Prompt Engineering的技术。
对于ChatGPT等大语言模型来说,它的输入是经过将一串文字转换的token,而大模型因为计算效率和内存限制,一般会设计固定的上下文窗口,限制输入token的数量。文本首先会被分词器(tokenizer)分词,并通过查表编号,然后embedding到矩阵中变成高维空间向量,这是文本向量化的过程,如下图所示。
由于token数的限制,因此要在有限的上下文窗口中将更全面的信息告诉大模型,就这需要用到Prompt Engineering提示工程技术。提示工程利用一些策略来优化模型输入,以便让模型产生更符合期望的输出。
ChatGPT的成功背后是以GPT为代表的大模型的技术演进,OpenAI相信大力出奇迹,不断扩大GPT的参数,GPT-1模型参数有1.17亿,GPT-2模型参数提高到了15亿,GPT-3达到了1750亿,而GPT-4的模型参数据称有1.8万亿。更多的模型参数也就意味着需要更大的算力来支持训练,OpenAI因此总结了“Scaling Law”,称模型的性能与模型大小、数据量和计算资源有关,简单的说就是,模型越大、数据量越大、计算资源越大,模型的性能就越好。强化学习之父Rich Sutton在他的文章《苦涩的教训》(the Bitter Lesson)中也表达了类似的观点,他回顾人工智能近几十年的发展路程,总结说短期内人们总是试图通过构建知识来提升智能体的性能,但长期看强大的算力才是王道。
大模型的能力也由量变转为质变,谷歌首席科学家Jeff Dean称它为大模型的“涌现能力”(Emergent abilities)。市场看到了这个机会,一方面,各大厂商在大模型投资上呈现军备竞赛之态,另一方面,大模型的开源生态也如火如荼。
## **五 Hugging Face**
2016年,法国人Clément Delangue、Julien Chaumond和Thomas Wolf成立了一家公司,起名为Hugging Face,并以该emoji图标为公司Logo. Hugging Face最初开发面向年轻人的智能聊天机器人,而后他们在训练模型的过程中开发了些模型训练工具并将它们开源,后来他们甚至调转重心来做后者,这种看似“不务正业”的做法却将他们带入了一个新的赛道,成为了深度学习领域不可或缺的角色。
硅谷有很多企业都是在副业上做出成就,比如Slack原来开发游戏,公司团队分布多地,在运作过程中开发了一款交流工具结果不小心火了,就是Slack。而Hugging Face的转向也类似,也是为了解决自己的痛点,2018年,谷歌发布了大模型BERT,而Hugging Face的员工便用了他们熟悉的Pytorch框架实现了BERT,将模型取名为pytorch-pretrained-bert,并将它开源到了GitHub。后来在社区的帮助下,又引入了GPT、GPT-2、Transformer-XL等一批模型,该项目便更名为pytorch-transformers。深度学习领域一直存在着两大框架Pytorch和TensorFlow之间的竞争,而研究人员为了比较两个框架的优劣,经常在两个框架间切换,因此该开源项目又增加了两个框架间的切换功能,项目名称也改成了Transformers。Transformers也成了GitHub上增长最快的项目。
Hugging Face继续开发了并开源了其他一系列的机器学习工具:Datasets、Tokenizer、Diffusers……这些工具也规范了AI开发的流程,在Hugging Face之前,可以说AI开发以研究人员为主,没有一套规范的工程化方法,Hugging Face则提供了完善的AI工具集并建立了一套事实标准,也使得更多的AI开发者甚至是非AI从业者可以快速上手并训练模型。
接着,Huggi[ng Face又基于G](https://hutusi.com/articles/the-greatest-git-commit)it和Git LFS[技术推出了托管模型](https://hutusi.com/articles/the-story-of-github-and-gitlab)、数据集、AI应用的Hugging Face Hub,到目前为止,平台上已经托管了35万模型、7.5万数据集和15万个AI应用示例。托管并开源模型和数据集,并建立全球的开源仓库中心这项工作富有创意且意义深远。上文提到,预训练+微调的方式促进了神经网络训练资源的共享,而Hugging Face Hub则更进一步,让AI开发者可以轻松复用全世界最先进的成果,并在此基础上添砖加瓦,让人人使用AI、开发AI的AI民主化成为可能。Hugging Face也被称为是机器学习领域的GitHub,或如他们的Slogan所言:构建未来的AI社区。我之前写过两篇文章,一篇《改变世界的一次代码提交》介绍Git,一篇《从零到百亿美金之路》介绍GitHub,而Git、GitHub、Hugging Face,我觉得它们之间存在某种传承,一种改变世界构建未来的黑客精神的传承,这也是促使我写这篇文章的原因之一。
## **六 后记**
在快要写完本文时,我看了辛顿最近在牛津大学做的一次演讲。在演讲中,辛顿介绍了人工智能领域的两大流派,一种辛顿称为逻辑方法,即符号主义;另一种他称之为生物方法,即模拟人类大脑的神经网络连接主义。而事实证明了生物方法明显战胜了逻辑方法。神经网络是模拟人类大脑理解而设计的模型,大模型也像大脑那样的工作和理解。辛顿认为,超越人脑的人工智能在未来会出现,而且会比我们预测的时间快得多。
## **附1 大事记**
1943年,麦卡洛克和皮茨发表“M-P神经元模型”,用数理逻辑解释并模拟人脑的计算单元,并提出神经网络这一概念。
1956年,“人工智能”一词首先在达特茅斯会议上被提出。
1957年,罗森布拉特提出“感知机”模型,并在两年后成功制造能够识别英文字母的硬件感知机Mark-1.
1969年,明斯基发表《感知机》,书中指出的感知机缺陷沉重打击了感知机乃至神经网络的研究。
1983年,辛顿发明玻尔兹曼机。
1986年,辛顿发明误差反向传播算法。
1989年,杨立昆(Yann LeCun)发明“卷积神经网络”(CNN)。
2006年,辛顿提出深度信念网络,开启深度学习时代。
2012年,辛顿和他的两个学生设计AlexNet在ImageNet大赛中以绝对优势获得冠军,深度学习被业界所重视。
2015年,Google收购的DeepMind公司推出AlphaGo,2016年战胜李世石,2017年战胜柯洁。OpenAI成立。
2016年,Hugging Face成立。
2017年,Google发表Transformer模型论文。
2018年,OpenAI基于Transformer架构发布了GPT-1。Hugging Face发布 Transformers 项目。
2019年,OpenAI发布GPT-2。
2020年,OpenAI发布GPT-3。Hugging Face推出Hugging Face Hub。
2022年,OpenAI发布ChatGPT。
## **附2 参考资料**
书籍:
《智慧的疆界:从图灵机到人工智能》周志明(著) 机械工业出版社 2018年10月
《深度学习革命》凯德·梅茨(著) 杜曙光(译) 中信出版社 2023年1月
《Python深度学习》(第2版) 弗朗索瓦·肖莱(著) 张亮(译) 人民邮电出版社 2022年8月
《深度学习入门:基于Python的理论与实现》斋藤康毅(著)陆宇杰(译)人民邮电出版社 2018年
《深度学习进阶:自然语言处理》斋藤康毅(著)陆宇杰(译) 人民邮电出版社 2020年10月
《这就是ChatGPT》 斯蒂芬·沃尔夫拉姆(著) WOLFRAM传媒汉化小组(译) 人民邮电出版社 2023年7月
《生成式人工智能》丁磊(著)中信出版社 2023年5月
《Huggingface自然语言处理详解》李福林(著)清华大学出版社 2023年4月
文章:
《神经网络入门》阮一峰
《2012,改变人类命运的180天》远川研究所
《GPT家族进化史》MetaPost
《Transformer - Attention is all you need》知乎
《预训练语言模型的发展历程》 知乎
《提示工程指南》
《ChatGPT 背后的“功臣”——RLHF 技术详解》
《ChatGPT大模型技术发展与应用》
《The Bitter Lesson》 Rich Sutton
《专访HuggingFace CTO:开源崛起、创业故事和AI民主化》
# 凯文·凯利2024最新演讲:从四个方向理解AI
> 来源:[https://aigcreative.feishu.cn/docx/FSoHdgDlzoa1Fwxoz0rcYcownug](https://aigcreative.feishu.cn/docx/FSoHdgDlzoa1Fwxoz0rcYcownug)
> 来源:腾讯研究院
> 链接:https://mp.weixin.qq.com/s/cV0y5QxGJRuO8-u-XCYmbA
** **3月29日,中信出版集团联合上海交通大学上海高级金融学院邀请到凯文·凯利(K.K.)来到中国,展开一场精彩的线下对谈。读者们熟悉的K.K.,是《连线》杂志的创始主编,是《失控》《必然》《5000天后的世界》等畅销书的作者。除了科技预言式写作,去年K.K.也正式出版了一本凝结了他 70 年人生经验的智慧箴言录——《宝贵的人生建议》。
现场,K.K. 以**《What's Next:in A**I and Digital World》为主题带来了他对于全球科技下一步发展趋势的深入思考和精彩见地,讨论了关于谁是AI的第一批使用者、AI与人类所产生的情感羁绊等问题。
以下是凯文·凯利演讲实录:
大家好,非常高兴能够见到各位。目前,技术领域的重要趋势,正在对全球的经济环境产生重大影响。大家可能都已经猜到了是什么——人工智能。
实际上我们对人工智能的了解并不深刻,并没有挖掘到人工智能实际存在的更多发展可能性。我们来谈论一种可能性,但需要注意的是,这是把技术置于场景下的可能性的延伸,并不是单纯的预测。有一点我们需要明确,世界上不只有一种AI,不同的行业行业有很多不同的想法和认知,也就意味着会有非常多纷繁各异的AI,这就像世界上存在各种物种的动物一样。
如果把众多截然不同的动物智能和机器智能汇总,我们会发现人类的智能发展并不是核心或者唯一。事实上,白痴和天才之间的区别并没有那么大。
在图谱当中存在着成千上百万的不同的智能,所以想拥有通用智能的想法是一种误导,就像我们在生物的谱系当中,也并不是处在最核心的位置,地球也并不在太阳系,或者是宇宙或者是银河系的核心,我们都是处在一个边缘的位置,智能也是一样。
我们与AI的关系可以从四种模式来思考。
# AI为人类提供完全跳脱的思维方式
**第一种叫人造外星人。**AI就像是降临到地球上的外星人一样,但是它是由人类来进行设计和编程制造的,可能超过了人类的智能,也有可能有认知。但最重要的一点是,他们并不像人,他们是一个硅基生物,有不同的认知和思维方式。
思维方式的不同,可能就构成了AI与人之间最大的不同,这并不是差错,而是特点,甚至是优势,他们可能会有创造性的思维,用完全不同于人的思维去做决策。
在新经济的时代,不同的思维方式是非常重要的,如果我们要在一个互联的世界生存,可能很难出现完全不同的、跳脱于所有人的思维方式,但是AI就可以做到,它可以帮助人们跳出常规思维,用一个全新的视角来去思考。所以我觉得AI中存在一些像ET这样的很聪明的智能体。
在过去的几年有一个让人们很惊喜或者惊讶的事情发生——以前我们会觉得电脑或机器是没有办法做有创造力的事情的,但随着新的A**I的应用,**人们发现机器也是可以产生创造力的。但是这些创造力并非是空穴来风,他们必须有人去给AI做出提示,那么这些人就叫做提示工程师。
在过去的几年我也一直在研究AI甚至是与AI共事,我尝试和AI共创一些东西。所以在新**的时代,可**能提示工程师将成为新一代的艺术家,他们和AI共同创造,我甚至把他们称为AI耳语者。
真正优秀的AI提示工程师或耳语者,他们可能要花一千个小时以上的时间和AI共事,他们用的AI和我们是一样的,但是他们却可以通过创造性的提示让AI去创作出非凡的东西,因为他们花了超过一千小时的时间去学习和练习,这就像是精通一门技艺一样,精益求精,熟能生巧。
同时他们也有一定的天赋,可以去了解AI背后的运作机制,现在招聘网站上已经可以看到这样的招聘信息了,年薪最高可以达到30万美元,这是给最优秀的人才所提供的机会。
之所以能给这么高的薪资,是因为要成为一个优秀的AI提示工程师是需要大量的练习和非常深厚的知识积淀和技术积淀的,大家现在也都会用一些开放的AI工具,你会发现提示确实非常的重要。
你需要去了解AI背后的思考链条,你需要让AI一步一步地去跟着你的思考。我们也发现了,现在AI的注意力非常短,他没有办法跟进一个很长的思维,所以你就必须把思维打碎,然后一步一步地喂给AI,这样才可以帮助AI实现一些复杂的任务。
# 你暂时不会被AI替代但会被更擅长使用AI的人替代
**第二点,如果说你给AI一些积极的情感反馈,比如你表扬他,**那么他就会给你一些更好的质量更高的答案。我们也不知道为什么,但是确实有这样的现象。你甚至可以告诉AI,你提的问题非常重要、生死攸关,请好好回答,这样AI就可以给你一个更高质量的答案。这些也是一些小小的窍门,帮助大家更好的运用AI。
我**认为这样的AI更像是一个普世的私人实习生,在座的各**位每一个人都可以拥有一个24小时的实习生,为大家服务,这就是AI可以做到的。比起助理,AI更像一个实习生,因为实习生不能独立完成任务,工作成果需要我们来做二次核验的。但即便如此也已经很好了,虽然这还不是我们最终的目标。
现在的大语言模型给我们的答案虽然不是最精确的,但是看上去已经非常合理了。有一些工程师每天的工作就是去设计一些合理的答案和输出,并不是最精确的答案,而是出最合理的答案,这也是设计和算法的策略。
他们是从大量人类语料中去提取信息来训练AI,其中包含了人类最精尖的信息,同时也有一些非常普通的,甚至是质量不高的信息。因此AI的水平就像是实习生一样,可以做一些初始性的工作,比如说设计一个大纲或草稿,这些任务他们可以完成得非常好。
通过研究发现,**对**知识型行业从业者来说,50%的任务都是可以由AI实习生来做到的。而其他50%的工作可以让AI去做一个草稿,然后由人来做提升。调查发现,如果使用copilot的话,程序员每天的生产力可以提升56%。
同样在其他的行业,比如说作者,他们使用AI的话,任务的完成速度会增加37%;比如律师、顾问,还有行政的工作,他们使用ChatGPT之后都有不同程度的效率的提升。最明显的效率提升,其实来自于低级别的工种或者是普通员工。
AI和其他的技艺一样,需要至少一千小时的练习和学习,才能够真正擅长,所以我认为未来人们的薪资将与你使用AI的能力挂钩。因此,人们不会简简单单地因为AI失去工作,但是确实有一些工作内容会改变。
**我相信在未来的5年以内人是不会被AI替代的,但是有可能会被一**个善于使用AI的人替代,这是普遍的趋势。如同现在看到的,即使有了自动驾驶,依然很少会有司机被自动驾驶所取代,但未来,司机的工作内容是会出现一定的变化的。
我给大家举个例子,美国有一个公司,他们用生成式AI去赋能服务台的工作人员,尤其是接线员,然后这些客服中心就可以去更加高效地服务客户。
在这个过程当中,他们确实也裁掉了一些人员,同时也招聘了更多技术支持人员。但是最常见的情况是接线员改变工作任务,会有一些AI没有办法处理的问题再转到人工。
与此同时,我们也看到正是因为AI把一些简单的工作都已经完成了,所以人可以专门处理一些比较棘手的问题,那么客户的满意度和服务质量都会提升。AI是相对平等的技术,即使是一些财力并不是很雄厚的企业或者是一些偏远的地区,他们没有充足的预算雇佣接线员,也可以运用AI提供客户服务。
除此以外,另一种AI应用趋势应运而生——艺术方面的提升。目前很少有画家、音乐家、或其他艺术从业者被AI完全替代,他们可能会用AI作为灵感来源。
因此从目前的生成式发展来看,我们很难在现阶段直接下定论AI会取代人。刚刚说到,AI的世界是基于规则的,因此,有时人觉得很简单的事情,对AI而言可能很难,换言之,AI觉得很容易的人可能会觉得非常困难,我们需要记住这个逻辑。
说到生成式AI与人之间的关系,我把它称之为+1关系。希腊神话中的半人马,其实是有点像人和AI的协作关系。科学家们发现,现阶段只靠人或只靠人工智能都不行,它们要结合在一起。
跟大家分享一个故事,埃斯特·佩雷尔是美国著名的治疗师,她做过很多公开的治疗,她有一个播客节目,记录了她上千上万小时的治疗过程。
有人根据她的治疗记录开发出了一个人工智能,人们可以直接去跟机器人沟通得到治疗,不知道埃斯特本人会不会喜欢这个AI版的她,她的书和播客节目都可以帮助到大家,但是人工智能会帮助更多。不过目前还涉及到宠物的治疗人工智能无法应对,但是确实开辟了一个新的路径。
不可否认,现在的人工智能医生还不如人类医生,但是人类医生与机器协作会做得更好。不过用AI来做医疗诊断是胜过没有医生的,一些遥远地区可能医疗资源短缺,无法接触到正常的医疗资源,在这种情况下,AI治疗总比没有医生好。
**这**就涉及到我们刚刚提到的第二个方面,人类和人工智能协作可以应用在各种领域,包括教育、法律、驾驶等,有的这些和人工智能相遇是1+1>2的概念。我们刚刚提到了实习生的概念,以后人工智能会成为合伙人、队友、教练、副驾驶助手等等。
就像我在《宝贵的人生建议》里说到的“如果你想走得快,就独自走;如果你想走得远,就一起走。”
# **当技术变得隐形时才是最强大的**
在过去一年里,生成式人工智能带来了许多激动人心的变化,比如神经网络技术得以与人工智能结合应用,**实际上神经网络技术不是新技术,网飞和亚马逊早就在使**用,这是一种识别+生成的技术。目前神经网络已经发展出两个全新的概念,一个就是大型语言模型,另一个叫做对话式用户交互界面。
大语言模型一开始是个非常简单的编程,10-15年前,我们其实是用它来做语言翻译的,因此当初训练它的目的是为了建立语言模型,将一种语言翻译成另外一种语言,用作训练的语料就是日常生活中的各种语言。
但是随着模型的不断练习,出现了一些有趣的变化。语言模型不仅做了翻译,同时还可以基于这些语料做推理。
因为语言不是单纯的进行信息的传递和传达,我们之所以会有语言,是希望语言表达思想,没有语言,思想也是匮乏的,所以语言跟推理能力密切相关。
当获得了语言能力时,它也在一定程度上获得了推理能力。这是开发人员们没有意识到的。所以推理是语言模型研究过程中获得的一个有趣副产物。
大语言模型在很多赛道有了全新的应用,基于大语言模型,他们获得了阅读推理的能力,人工智能可以帮助我们做很多测试,且高分通过。
回到刚刚的概念上,目前这些模型都是基于普通人的数据收集做的建模。我们也希望未来可以进一步优化,使用天才的语料进行训练。
还想给各位介绍一下**对话式用户用户界面**,这与20年前的图形用户界面有异曲同工之妙。在互联网之初,我们看到这些电脑就是这样的,只有一些单纯的文本,没有图形,而且很难用。很多人也没有觉得这样的应用有趣。现在已经截然不同了,随着万维网的使用,你可以看到有图片的交互形式,可以拖拽信息,这样更加贴合人类的诉求。
你不用再去上繁琐的编程和代码课也可以理解它呈现的信息。现在有了大语言模型后,你可以进行对话式沟通,从而生成图文,我们会发现文本信息转化成视觉信息非常符合人类的沟通诉求,这极大改变了现在的技术应用,包括语言理解、手势识别。比如目前很多设备可以采集你的唇语,你不用像以前一样用吼的方式来进行沟通了。
这些技术极大地改变了行业。**所以**我的建议是未来几年初创企业将变得非常的容易,只需要将一些东西添加到对话式使用界面中,比如你可以和面包机、汽车对话,AI也会变成商品的一种形式,AI交互页面会成为区别其质量的一个关键所在。现在有个很有名的引擎叫做perplexity,它做的不是AI本身,是AI的交互界面。就像是水是免费的,但装到瓶子里就有了矿泉水,它就是产品了。AI的交互界面是可以创造额外价值的。
回到我刚才所说的,当技术变得隐形的时候才是最强大的。我们现在在这个房间当中有大量的技术存在,比如电灯、水管、风扇、通风管道等,我们意识不到他们的存在,这意味着这些技术已经成功了。
同理,**我们一直在谈AI,说明它还没有成功,如果说我们已经无法意**识到AI的存在了,那么就说明AI成功了。在未来我是相信95%的AI应用我们都没有办法看到,他们就像管线系统一样在后台运行。未来我们将更熟悉它的前台界面,大多数人可能甚至不知道它背后由AI运行。
现在有很多技术公司试图用AI去预判、预测未来。在过去包括现在,如果要单纯靠人力来完成的话,它是一个非常耗时非常昂贵的工作。但是未来有了AI的介入,那么预判这件事情将变得非常简单。
AI的技术会存在于两个阶段,**一个是内部的流程阶段,**包括编程工作、金融分析,或者是传媒和沟通;另一个是外部使用AI来制作产品,这是大家在公众视野当中可以看到的,比如说自动驾驶汽车机器人。目前为止,内部运行的AI更为强大,我相信这也是未来AI重要的增长点。
**我们把AI类比成电力,你不能简单地认为把18世**纪的公司通电,它就会成为完全不同的公司。但是如果这家企业在诞生之初就有电力的加持,那么这一家企业和18世纪的其他企业相比,一定有巨大的飞跃。AI也是一样,下一代AI原生企业的商业模式一定是和AI发展前的企业是完全不一样的。
有些工作是人类不想做的,有些工作是人类可以做的,还有些工作甚至是人类完全未知的。AI能够起到最大作用的地方,不仅仅是在人类不能做的,更是在于去探求完全未知的工作。
# **社会中层往往是第一批AI使用者**
那么在商业场景中,第一批的AI使用者有哪些?
除了我刚刚介绍到的客服工作以外,还有程序员,现在程序员已经在使用微软copilot这样的AI辅助工具了。有了AI加持之后,这些程序员表示再也不想要回到没有AI的时代;同时在营销领域,工作人员也在大量使用AI去生成物料、图像、视频等等。
我觉得AI的第一批应用行业,包括软件、医疗、教育、营销和保险。保险大家显而易见了,AI可以设计保险政策、进行数据分析等等,在教育领域,最大的受益者就是学生,在医疗领域就是患者,在企业的环境当中应该是员工受益。
**但**其实我们发现事实与预想的恰恰相反,老师对于AI的热情远远要大于学生,医生的热情大于患者,领导者的热情大于普通员工。比如说老师,有了AI,他们每天可以节省几个小时的备课时间,医生和经理也是一样。所以我们发现在一个企业或者行业结构当中,中层反而是受益最大的,他们反而是第一批的AI使用者。
另外我们发现一点,年轻的初创企业往往最先运用AI。公司越小,运转就更加灵活,他们就更有机会全面使用AI。大公司的脚步就会相对落后。这是一个自然进化的过程,从18世纪开始,企业一步一步从工业模式一直进化到现在的数字模式,在数字时代,中国企业搭上东风,实现了快速的成长。
之**后是云计算的时代,现在我们正在全面拥抱AI,但云**计算这一步是不能略过的,我们需要去打好基础,实现完善的云计算部署。换句话说,企业要进行完善的云计算或者云平台的部署,然后才可以在云计算的基础上来发展他们的AI实力。
现在AI还可以生成视频。其实好几年前就已经在讨论这个趋势了,换句话说,它已经可以去生成世界的一个小片段或者小部分了。现在AI可以生成狗的视频,未来就不难想象AI可以生成一个完整的事件。这些在以前需要一整个技术团队才能够实现,而现在只需要一个人。
JK罗琳创造了哈利·波特的世界,她一个人创造了一个魔法世界,她是一个天才。但是即便她有如此大的想象力,也依然无法独自制作7部哈利·波特电影,但有了AI,一个人是可以实现这一点的。正如我们一开始所说的,即使AI现在所接受训练的语料和物料质量还不是最高的,但是从这些大量的训练当中依然可以产生出非常优秀的内容。
我们同时也意识到,AI素材可以实现增强现实的功能。苹果、谷歌也都推出了其现实增强的产品,我称之为“镜像世界”,我在《5000天后的世界》中也有详细说明,但是如果背后没有成本较低的AI技术的支持的话,那么这些终端产品是没有办法普及的。AI是增强现实产品的基础。我认为增强现实和AI是相挂钩的,它甚至可以说是AI的变相。
在我们需要AI协助的过程中,AI也在学习这个物理世界。现在苹果已经推出了Vision Pro,但是我觉得这个产品要普及可能还需要十年的时间,但有了AI增强的话,AI可以读取物理世界,快速生成数字孪生。有了VR产品,人们可以在虚拟世界遨游。
但是这些眼镜仍然有一个局限——每次使用的时候都需要扫描一下身边的环境,它需要去识别你处在哪个房间,哪里有窗户,哪里有房,哪里有门。但是如果有了AI加持的话,它就可以去自动理解身边的环境,不需要一遍一遍去扫描,最终将整个世界输入镜像世界中。世界上的任何电子设备都可以看见镜像世界,这是机器人和自动驾驶汽车所看见的世界。
未来,数据世界和人类世界交织在一起,我觉得镜像世界的社交属性很强,所以在这方面的培训工作潜力无限。未来,人们在某项工作或技术正式启用之前,可以在镜像世界里完成实训和试错。
# **AI将与人建立更多感情羁绊**
过去一年,很多翻天覆地的技术变化都是由人工智能来驱动的,人工智能带来了前所未有的创意。未来如果人工智能会产生情感属性,那可能会让很多人觉得匪夷所思。
AI为什么会产生情感属性呢?有以下几个原因。
**首**先,对话是人类沟通的自然表达,人们不自觉地代入情感,即使面对AI,我们也会用到这种原始情感,AI会通过你的语言和表情感受到原始情感的传递。比如说它看到了你的视线,就会知道你现在走神了,或者通过你语调的变化感觉到了情感的变化。在语言表达的同时读取并处理了人类信息,比如像爱、喜悦、恐惧、顾虑、惊喜。
人会跟宠物有很强的情感羁绊,比如狗狗或者小猫,可能在未来会跟人工智能有更强的羁绊,它就会像一个能够说话的小狗。你可以想象一下,如果你的小狗能够用你能理解的语言对话,你跟它的羁绊就会更深,所以这也会成为未来技术发展的趋势。虽然可能刚开始会让很多人觉得不习惯,但是随着情感嵌入技术的发展,你可能会发现这种羁绊感是超过了你的预期。
就像上面说的,AI的种类非常多,他们可能会有不同的性格,你需要找到跟你合得来的AI。在过去几年中,我们从生成式人工智能中获得的一切,都是基于已经有五十年发展基础的神经网络技术。迄今为止,我们就像拥有了一个人造大脑,这个大脑可以进行多种认知,目前我们对神经网络的开发十分有限,未来我们还有很长的路要走。很多AI专家认为,人类是不可能用一种技术覆盖所有的应用场景,除了神经网络之外,我们还可以加入像模糊逻辑、规则判断这些技术。我们正处于人工智能发展初期,还有一些AI是尚待开发,可能三十年后,未来的人类再回顾2024年,会觉得2024年的AI技术都不叫AI,当然这是后话,现在的AI专家展望过去也是一样的。
AI还处于一个萌芽期,未来三十年AI会有什么样的发展路径,没人能够预判。但是至少目前这些分析可以帮助我们更好地为未来做规划,AI能够帮助我们判断哪里AI做得好,哪里人类做得好,同时还可以剖析一下哪些是希望人来做的,帮助我们更好地认清现实、理清路径。
相信这些机器可以帮助人类成为更好的人类,这是我们的最终目标。
感谢各位的耐心聆听。
# 思维模型
> 来源:[https://aigcreative.feishu.cn/docx/YiirdHFJBoO328xn3n9cjRgOn7c](https://aigcreative.feishu.cn/docx/YiirdHFJBoO328xn3n9cjRgOn7c)
> 内容源自互联网,图片由创意猎人整理制作。
# 知识库动态
# 50种认知性偏差
> 来源:[https://aigcreative.feishu.cn/docx/JBOHdt3YNoNubnxoftGcojgbnRc](https://aigcreative.feishu.cn/docx/JBOHdt3YNoNubnxoftGcojgbnRc)
# 中文版
# 英文版
# 知识库动态
# 如何搭建个人知识体系?(方法篇)
> 来源:[https://aigcreative.feishu.cn/docx/HehDd9IXXohSUuxoFp8caFNln1f](https://aigcreative.feishu.cn/docx/HehDd9IXXohSUuxoFp8caFNln1f)
> 作者:孟埃里克 公众号:Mtian梦天
> 链接:https://mp.weixin.qq.com/s/2WB4IjlC0PSQ_ftWSyYvlw
# 引言
凡是那些取得卓越成绩的背后一定有一套完备的方法论。因此,我们在学习任何知识时,应该先是寻找方法论,然后搭建知识框架,最后围绕知识框架再去填充具体内容。其实,很多时候,我们不是缺乏学习的动力,而是找不到应该如何学习的方法,下面这篇文章将会告诉大家如何搭建一套个人知识体系的方法论,虽然谈不上万能,但是非常具有借鉴意义。
# **一、知识体系搭建误区**
## 误区一、知识体系等同于知识的堆砌
知识体系不仅仅是知识的简单集合,而应该是一个有序、有组织的知识结构,它需要将知识进行分类、分层、整合,使之成为一个有机的整体。
## **误区二、忽视知识体系的动态性**
知识体系不是一成不变的,它需要不断地更新和优化。因为新的知识会不断地出现,原有的知识可能会过时或被修正。
## **误区三、忽视知识体系的实践性**
知识体系不仅仅是理论上的构想,更应该是实践中的运用。因此,搭建知识体系时应该考虑其实践性和应用性。
## **误区四、忽视知识体系的个性化**
每个人的知识背景、专业领域和兴趣爱好都不同,因此在搭建个人知识体系时应该根据自己的需求和特点进行个性化的构建。
## 误区五、盲目追求大而全的知识体系
搭建知识体系不是追求大而全,而应该根据自己的实际需求和实际情况进行有针对性的选择和构建。因而,为了避免出现以上误区,建议大家在搭建知识体系时应该注重知识结构的系统性、动态性、实践性和个性化,同时避免盲目追求大而全的知识体系。要根据自己的实际情况和需求进行有针对性的选择和构建,不断地更新和优化知识体系,以保持其时效性和实用性。
# **二、知识体系搭建方法**
“工欲善其事,必先利其器”,这个原理同样也适合个人知识体系的搭建。因此,想要搭建一套个人知识体系我们就必须先把工具准备好,在这里我们给大家推荐两套知识体系搭建方法。
## **方法一、大树模型**
大树模型是一套根据大树结构衍生出来进行知识体系管理的模型,它适用于任何领域,其管理原理为从树根开始去发现自身问题,然后去寻找解决方案的逻辑,通过以树干为目标,树枝和树叶为执行方案,最后通过成果为复盘思维的方式进行知识体系管理,如下图所示。
**1.根,找到“根”源**
找到内心“根”源,烦恼是什么?比如:
烦恼一:不会沟通,不会表达。
烦恼二:工作没有激情,每天浑浑噩噩。
烦恼三:学习没有进步,不高效。
**2.干,找到目标**
写下你想在树干上实现的目标?比如:
目标一:提升演讲表达能力!
目标二:提升工作的幸福感!
目标三:培养高效学习方法!
**3.枝,如何实现**
将每个目标分别用一个树枝来表示。比如:
树枝一:培养沟通表达!
树枝二:如何才能幸福工作?
树枝三:养成高效的学习方法~
**4.叶,落地执行**
再将树枝上的目标分散到每一片树叶上。比如:
树叶一:通过书籍学习一些演讲和表达的方法。
树叶二:反复练习演讲和表达。
树叶三:参加培训课程,请教高人。
**5.果,开花结果**
将开花结果作为自己的学习成就,定期验收是否实现了这些目标?比如:
果实一:是否在演讲表达上有了提升?
果实二:是否爱上了你的工作?
果实三:是否学习上有了一些改善?
## **方法二、收纳箱法**
收纳箱法是一种常见的知识体系搭建方法,其原理是找到自己想要搭建的知识领域,创建一个个文件夹收纳箱,然后将相关文档都存放在收纳箱中,如下图所示。
关于使用收纳箱法搭建个人知识体系,我们提供两点说明。
**1.收纳箱层次结构**
一般来说,使用收纳箱法进行知识体系管理,建议不要创建超过三级以上的层级,否则知识会过于存放太深,不利于使用。
**2.建立临时收纳箱**
将一些临时要用的文件,统一放在临时收纳箱,用完后立即进行清除,觉得有必要的知识可以迁移到具体的收纳箱中。使用临时收纳箱的好处就是提前解放某个收纳箱的内容存储,因为有些时候我们把只需要使用一次的文件存放在常用收纳箱中其实是一种存储困扰。
# **三、知识体系搭建标准**
## **标准一、面线点化**
在构建知识体系时,可以参考面-线-点的模式。首先,一级是面的知识概括,即对整体知识的全面理解;其次,二级为线知识小结,即对各个主题的深入研究;最后,三级为点知识内容,即具体的知识点和细节。
面线点化可以帮助我们将知识体系串联起来,使其更具连贯性。这样,我们在获取知识内容时就有了一个清晰的框架,只需查看相应的目录,便能迅速找到所需的知识内容。
## **标准二、知识图谱**
构建知识体系并非孤立的过程,不同领域的知识体系最终会融合成一个全面的知识图谱。利用知识图谱,我们可以迅速地将各种知识内容进行归纳整理。
知识图谱的构建不仅提高了我们的学习效率,还拓宽了我们的知识视野。通过知识图谱,我们可以发现不同领域之间的关联,激发创新思维。同时,知识图谱也为我们提供了一种全新的学习方式,使我们能够更加系统、深入地理解和掌握知识。
# **四、知识体系搭建工具**
## **文档类工具**
所谓文档类工具,是指用于文字,图表,ppt,思维导图,流程图类文档工具,这类工具的选择建议使用在线版本,因为使用在线版本可以手机端和电脑端同时使用,无论是在公司,在家里,出差等都能实时使用在线文档工具。一般在线文档工具可以使用腾讯文档,飞书,石墨文档,语雀,wps,金山办公等,这些都是目前比较主流的在线文档工具。
## **设计类工具**
搭建个人知识体系过程中难免会用到一些设计类工具,比如PS,XD,Sketch等,无论使用哪块软件,只要能够满足我们设计需求就行,由于我是产品经理,这里可以推荐使用一款原始设计工具Axure,一些草图和精美的设计稿其实也可以使用Axure进行设计。
## **存储类工具**
存储类工具主要是用来存储一些大内存的文档,图片,视频等,在这里我推荐使用百度网盘。因为百度网盘是大公司的产品,不容易说后续不迭代了。而在使用百度网盘之前我有很长一段时间使用过360云盘,当时360公司宣布360不再提供个人版本时,我费了好大的劲才从360迁移到百度网盘,这些年一直在使用百度网盘,使用体验还不错。
# **五、 知识体系搭建落地**
知识体系最后落地搭建其实是解决的如何记录知识的问题,在这里我们推荐三个方法,它们分别是思维导图法,卡片图形法,图表清单法。另外稍微说下,搭建个人知识体系最不推荐的是使用纯文字记录,不仅枯燥,后续也不利于复盘使用。
## **方法一、思维导图法**
所谓思维导图法,是一种利用思维导图工具进行知识整理的方法。这种方法的核心是按照知识的总-分-总或者总-分模式,将知识内容进行分门别类。思维导图法可以帮助我们更好地理解和记忆知识,提高学习效率,如图所示。(图片来源网络)
## **方法二、卡片图形法**
所谓卡片图形法,就是利用卡片+图形方式将知识有逻辑的进行整理,以达到结构清晰,层次分明的知识构建方法,如图所示(图片来源于网络)。
## **方法三、图表清单法**
所谓图表清单法,就是使用图+表格的方式将知识按知识清单的方式进行记录,该方法不讲究逻辑原理和层次结构,其核心主要完整记录知识。
# 最后的话:
最后,我们来做一个总结:如何搭建个人知识体系?
1、 误区:搭建知识体系不等同于知识堆砌,不要忽略知识体系的动态性、实践性、个性化,以及不要盲目追求知识体系的大而全。
2、 方法:大树模型法和收纳箱法。大家两种方法都可以尝试使用。
3、 标准:面线点线性标准和网络化知识图谱。
4、 工具:一般使用文档,设计,工具三类工具即可搭建一套知识体系。
5、 落地:可以使用思维导图、卡片图形,图表清单方法进行知识内容记录。
以上是我对搭建个人知识体系的一些思考,希望对你有所帮助。
# 如何搭建个人知识体系?(工具篇)
> 来源:[https://aigcreative.feishu.cn/docx/RPRMdfjvGo1PYhxcmhrctdZ9nNd](https://aigcreative.feishu.cn/docx/RPRMdfjvGo1PYhxcmhrctdZ9nNd)
> 作者:孟埃里克 公众号:Mtian梦天
> 链接:https://mp.weixin.qq.com/s/9-_aJB61C6npIPiZlBQaFg
# 引言
在如何搭建个人知识体系(方法篇)一文中,我们探讨了构建个人知识体系的误区、方法、标准和工具。现在,我们将继续深入讨论(工具篇),这部分内容更侧重于如何使用一些工具将知识从输入、整理、沉淀到输出的过程转化为我们自己的知识。
你是否有过这样的体验:尽管我们每天都在学习各种有用的知识,但当我们需要运用这些知识时,却发现自己并没有真正记住它们。原因在于,我们没有利用适当的工具来有效地存储这些知识。而这篇文章正是为了解决这个问题而撰写的。相信阅读后,你会对使用工具记录知识有全新的理解。
# 一、输入
互联网时代我们获取知识的途径变得多样化,但无外乎还是下面两种:书籍、网络。书籍作为传统的知识载体,具有系统性和深度性,适合深度学习和研究。而网络则提供了更广泛的信息来源和便捷的获取方式,尤其适合快速了解新事物和获取实时信息。因此,在获取知识时,我们可以根据需求灵活选择书籍或网络作为信息来源,将两者优势互补,提高获取知识的效率。
## **1.书籍**
书籍主要分为纸质书和电子书两种。随着科技的发展,纸质书的阅读频率逐渐降低,人们更倾向于追求一种情怀。相比之下,电子书则成为了获取知识的最佳方式。然而,在阅读畅销书时,我们需要保持警惕,因为并非所有畅销书都能给我们带来真正的价值。在通过书籍获取知识内容时,学会辨别书籍的实用价值至关重要,以免被误导,阻碍我们构建知识体系。
## **2.网络**
在当今数字化时代,我们获取知识的方式多种多样,包括新闻网站、移动应用、新媒体、公众号和短视频等,这些都是我们获取知识的有效途径。然而,这些途径在提供丰富信息的同时,也带来了信息过载的问题。我们很容易被大量无关信息所淹没,难以找到真正有价值的知识。因此,在利用这些途径获取知识时,我们需要学会筛选和辨别,找到真正值得信赖的信息来源,提高我们的信息素养。同时,我们也需要学会管理我们的信息获取渠道,避免被无用信息分散注意力。简而言之,在利用书籍和网络等资源获取知识时,我们需要进行筛选和提炼,以区分真伪,摒弃无用信息,吸收精华,从而为我们后续的知识整理工作奠定基础。
# **二、整理**
一般来说,我们将知识整理分为三个方向:常用类知识、收藏类知识以及存储类知识。它们之间的区别如下:
**常用类知识:**这类知识是我们在日常生活中和工作中经常需要运用到的。它们通常是一些基本技能、常识或工具,能够帮助我们更有效地处理问题。
**收藏类知识:**这类知识可能不常被使用,但它们对于我们的知识体系和兴趣来说仍然具有很高的价值。例如,我们可能收藏了一些关于历史、艺术或科学的知识,尽管我们不会每天都用到它们,但它们仍然丰富了我们的视野和思维。
**存储类知识:**这类知识是我们认为重要但并不经常需要的知识。它们可能包括一些专业领域的知识、学术研究或特定领域的技能。尽管我们可能不会每天都用到这些知识,但在需要时,它们能够为我们提供重要的信息和指导。总之,常用类知识、收藏类知识和存储类知识在我们的知识体系中扮演着不同的角色,它们共同构成了一个丰富多样、实用的知识库。
## **1.常用类知识**
### **1.1文档类工具**
当前,主流的文档类工具包括腾讯文档、石墨文档、语雀、金山文档、WPS和飞书。这些工具各具特色和优势,大家可以根据自己的需求和喜好选择合适的一款使用。
### **1.2知识类工具**
知识类工具是我为自己定义的一种平台,主要用于储存知识,并方便与他人分享。目前,我正在使用知识星球,其体验相当不错。此外,还有一些其他平台,如小报童(具有一定知名度,但需要申请机制,要求全网粉丝3000+,因此对新手不太友好),以及纷传(与知识星球类似,但知名度较低)。
### **1.3笔记类工具**
笔记类应用主要用于捕捉瞬间的灵感或记录即时会议。这里推荐三款工具:语雀小记、浮墨笔记和微信笔记。在这三款工具中,建议使用语雀小记,因为它是语雀系列产品的一部分,有助于后续的语雀数字花园创作。
### **1.4写书类工具**
语雀知识库是一款优秀的文档类工具,特别适合撰写书籍。它能够将多篇文档结构化,方便知识的创作与沉淀,使用体验良好。因此,如果你只想在平台端分享书籍,语雀知识库是一个不错的选择。但如果你希望将书籍下载进行存档或出版,建议使用腾讯文档或飞书等其他工具。
### **1.5思维类工具**
思维类工具主要用于提炼知识和书籍结构的核心内容,在这里,我们推荐使用Xmind、MindManager和知犀思维导图等。这些工具各自具有独特的特点,但一些高级功能通常需要会员身份才能使用。大家可以根据自己的需求考虑是否购买会员。
### **1.6大纲类工具**
大部分思维导图工具都具有大纲笔记的功能,这里主要想推荐幕布极简大纲工具,它是一款广受好评的思维导图兼大纲类工具,它具有强大的大纲笔记功能,可以帮助你将知识进行结构化处理。通过简洁直观的界面,可以轻松创建、编辑和组织你的思维,无论是写作、学习还是工作,都能让你更有条理。此外,幕布极简大纲工具还具有层层连贯、抽丝剥茧的特点,让你的思维更加清晰。
### **1.7设计类工具**
如果你有设计基础,我建议你尝试专业的设计软件,这里就不详细介绍了。但如果你的设计基础相对较弱,我建议你使用Axure原型设计软件。我的公众号中许多设计图稿都来源于这款软件,可以说它是一款入门相对容易的设计工具,能够满足我们日常工作中的大部分设计需求。
### **1.8流程图类工具**
在处理复杂知识时,我建议大家使用流程类工具,以便更好地理解和整理知识结构及逻辑。特别推荐微软的Visio,这是一款功能强大的流程图制作工具,能清晰地展示知识点间的关系,使复杂内容变得简单易懂。另外,一些在线文档工具如腾讯文档、飞书、金山文档和WPS等也具备流程图功能,方便在文档中直接创建流程图,让知识整理过程更便捷高效。
1. **收藏类知识**
在我的个人知识体系建设过程中,我意识到直接进行知识收藏的工具并不多,更多的是一些软件附带了这部分的功能。虽然这类工具并不常见,但它们在我们的学习过程中发挥着重要的作用。接下来,让我们详细讨论一下这些知识收藏类工具。
### **2.1网页端链接收藏工具**
收藏网页知识内容一直是我工作中非常重要的一部分,尤其是使用浏览器的收藏夹功能。从参加工作起,我就一直在使用这个功能来整理和保存知识内容。虽然所有主流浏览器都具备收藏夹功能,但我更推荐使用360浏览器。因为它的收藏夹内容可以实现多终端同步,无论是在公司电脑收藏的内容,还是在家里或手机上,都可以轻松同步,非常方便。这也是我为什么一直在使用360浏览器的主要原因,其实更多的是因为它的收藏夹功能。
### **2.2公众号文章收藏工具**
不知道大家有没有注意到,微信其实也有收藏功能,可以用来收藏文档、图片、聊天内容等。然而,很多时候我们虽然收藏了,却很少打开浏览。这个收藏功能的定位可能仅仅是作为内容存储。因此,在微信中还有一个浮窗功能,针对公众号文章可以选择该功能进行临时收藏,以便快速获取阅读。
### **2.3好词好句收藏工具**
根据我的个人习惯,我会创建一些微信群,实际上这些群组中只有我一个成员。我通常会将一些精彩的词汇、优美的句子或特别有趣的内容收藏在这些群组中亦或是使用微信传输窗口。这样做一方面方便我收藏,另一方面,当我需要调用这些信息时,可以快速找到。
## **3.存储类知识**
### **3.1非常用文件工具**
针对一些不常用的文件类型或大型文件,如视频和书籍等,我建议您选择云盘进行存储,例如使用百度网盘。百度网盘提供大量的存储空间,支持多种文件格式,包括视频、图片、文档等。你可以将文件上传到百度网盘,随时随地通过手机、电脑或平板电脑进行访问和下载。此外,百度网盘还提供文件分享功能,你可以将文件分享给他人,方便协作和交流。
### **3.2常用文件工具**
我建议将常用的文件存储在电脑桌面或专用的文件收纳箱中,以便在需要时能够快速找到。特别是对于桌面存储,它可以让你在需要时立即获取文件。将文件存储在电脑桌面上,可以使你在打开电脑后一眼就看到所需的文件,大大提高了工作效率。而专用的文件收纳箱则可以帮助你更有条理地管理文件,使得文件查找更加方便。无论你选择哪种方式,都要确保文件存储的易访问性,以便在需要时能够快速找到。
# **三、沉淀**
在沉淀阶段,我会对输入的知识进行深度加工和理解,将其内化为自己的一部分。这个过程可能包括制作思维导图、撰写文章、录制教学视频或设计课程,甚至于出书。通过这些方式,我们不仅能够巩固自己的知识,还能与他人分享,进一步加深对知识的理解和掌握。同时,通过分享和交流,我们还可以获取他人的反馈和建议,从而不断完善自己的知识体系。
## **1.文章**
文章沉淀是一种非常有效的写作方法,它可以帮助我们更好地组织和表达思想。使用在线文档或电脑本地的txt文档都是可行的选择,这些工具各有优缺点,关键是选择适合自己的方式。在线文档通常支持实时保存和多人协作,这对于需要与他人共同完成文章的人来说非常方便。而电脑本地的txt文档则更加轻便,可以随时随地进行编辑。无论选择哪种工具,最重要的是要保持写作的连贯性和持续性,这样才能真正发挥出文章沉淀的优势。
## **2.专栏**
知识内容在进行专栏系列输出时,建议大家选择一些专业的工具,以便于后续的留存和修改。例如,在线工具如腾讯文档和语雀这样的大平台。这些工具不仅可以帮助我们更好地组织和管理知识内容,还可以提供多种编辑和协作功能,方便我们与他人共同创作和修改。同时,这些平台的数据安全性和稳定性也更高,可以确保我们的知识内容得到妥善的保存和备份。因此,选择专业的工具进行知识内容的输出和管理,不仅可以提高我们的工作效率,还可以为我们的知识积累提供更好的保障。
## **3.课程**
拥有强大知识储备的朋友们,可以将自己所学的知识转化为课程形式,这不仅是一种对知识的梳理和总结,还可以通过发布或销售课程来获得一定的回报。实际上,这是一种对知识学习的回馈,我自己也正在尝试这种模式。到目前为止,我发现这种方法的效果相当不错。
## **4.出书**
相比撰写课程,出书的要求确实更为严格,但这对于个人知识体系的沉淀效果无疑更为显著。同样,对于有这方面想法和实力的朋友,也可以尝试一下出书的过程,因为它会迫使自己去学习相关领域的知识。在完成一本书的撰写后,你会发现自己的知识体系得到了极大的丰富和拓展。
# **四、 输出**
对于我而言,所有输入整理沉淀后的知识我都会选择一些工具进行对出输出,目前主要包含有公众号,小红书、付费平台、短视频,下面简单说说。
## **1.公众号**
公众号作为社交领域的重要组成部分,具有强大的对外传播能力。尤其是在当前阶段,腾讯对于公众号公域流量的支持力度较大,这为我们提供了更多的机会。只要我们创作的内容具备足够的价值,通常都会在公众号上得到良好的反馈。因此,对于创作者来说,公众号是一个极具潜力的平台,我们可以通过这里分享自己的观点和知识,与更多的读者建立联系,从而实现自己的价值。同时,公众号的传播能力也可以帮助我们扩大自己的影响力,提升自己的知名度。因此,我们应该充分利用公众号这个平台,创作出更多有价值、有深度的内容,让更多人受益。
1. **小红书**
小红书作为当前备受推崇和实践的自媒体平台之一,吸引了众多大V知识博主在此售卖自己的课程内容。这些博主通过在小红书上分享自己的专业知识和经验,获得了大量的关注和粉丝。许多人通过在小红书上售卖课程内容,取得了不错的成绩,并获得了丰厚的回报。这不仅提高了他们的知名度,也为他们带来了更多的商业机会。因此,小红书已经成为许多自媒体人士的首选平台,他们在这里找到了实现自我价值和创造财富的机会。
1. **付费平台**
对于已经拥有一定粉丝基础的朋友来说,可以选择一些知识付费平台进行内容输出,比如现在大家普遍使用的知识星球和小报童。这些平台为广大知识大V博主提供了展示自己才华的舞台,同时也让他们找到了自己的价值所在。通过在这些平台上分享自己的知识和经验,他们帮助了更多渴望成长和进步的朋友。知识星球和小报童等知识平台的存在,使得知识传播变得更加便捷和高效,为知识的交流和分享提供了更多的可能性。
1. **短视频**
与知识内容平台相比,短视频平台在当前也扮演着举足轻重的角色。在构建个人知识体系的过程中,我们不仅可以通过写作来对外分享知识,还可以尝试录制短视频,以专栏的形式进行对外发布和宣传。这种方式特别适用于商业课程和技术栈等内容。实际上,许多商业课程和技术栈已经在短视频平台上取得了巨大的成功,吸引了大量观众的关注和参与。因此,对于希望分享自己专业知识的人来说,短视频平台无疑是一个极具吸引力的选择。
# 最后的话
好了,关于工具篇,我们就分享到这里。下面,让我们做一个总结。本文主要从四个维度探讨了搭建知识体系的工具选择。
**输入:**分享了如何获取知识的途径,其工具就是书籍和网络渠道。
**整理:**分享了如何通过工具去整理常用类知识,收藏类知识,存储类知识。
**沉淀:**分享了如何将知识通过文章,专栏,课程,出书等工具形式进行沉淀。
**输出:**分享了如何将知识通过自媒体平台,如公众号,小红书,知识付费,短视频对外输出。
# 如何搭建个人知识体系?(实战篇)
> 来源:[https://aigcreative.feishu.cn/docx/M5KTdr8rHor3D1xglBXcd0K8nCC](https://aigcreative.feishu.cn/docx/M5KTdr8rHor3D1xglBXcd0K8nCC)
> 作者:孟埃里克 公众号:Mtian梦天
> 链接:https://mp.weixin.qq.com/s/C6hH3xVDwIofwqrRwW4o3A
# 引言
知识体系的搭建不是一蹴而就的事情,所有知识的搭建其实都是一个积累的过程,但往往很多人不知道如何去搭建自己的知识体系,主要原因还是缺少方法。因此,今天这篇文章就手把手告诉大家如何搭建。
# **一、 知识管理框架**
[在之前的文](http://mp.weixin.qq.com/s?__biz=MjM5MDc0MzgyMQ==&mid=2647604211&idx=1&sn=116b7cd491200baaf4f3823ddb6532c1&chksm=be7bb791890c3e87b7eba83b0207922cc617a5563226afac3552d5f1507b52c69927aa82ef06&scene=21#wechat_redirect)章[中我分享了](http://mp.weixin.qq.com/s?__biz=MjM5MDc0MzgyMQ==&mid=2647604214&idx=1&sn=b25038c42c564f3e13afe0b1a9df0eae&chksm=be7bb794890c3e82c1d2f54601d4ae4820dd81d308eeb51372fe5c9c366cacf50abacff658c1&scene=21#wechat_redirect)如[何搭建个人](http://mp.weixin.qq.com/s?__biz=MjM5MDc0MzgyMQ==&mid=2647604211&idx=1&sn=116b7cd491200baaf4f3823ddb6532c1&chksm=be7bb791890c3e87b7eba83b0207922cc617a5563226afac3552d5f1507b52c69927aa82ef06&scene=21#wechat_redirect)知识《方法篇》和《工具篇》,今天,我们继续给大家分享这个系列的最后一篇文章《实战篇》。下面是我搭建知识体系的框架模型——收纳箱模型,它也是我在《方法篇》文章中分享的一种搭建知识体系的方法,如下图。
这个方法的结构其实很简单,也很容易学习使用,大概的模式就是先创建一个临时收纳箱,然后把收集到的文档临时存放到这个文件中,一般在学习和使用后,我们需要甄别该文档是否有价值,如果有就将其移入工作和个人收纳箱中,否则就果断清理。
## **1.1临时收纳箱**
临时收纳箱,可以简单理解为它是一个知识的临时中转站,所有信息达到这里只有一个目的就是短暂的进行存储,然后供下一步的收纳整理。
## **1.2工作收纳箱**
工作收纳箱主要用于存放工作的最顶层文件夹,所有关于工作的文档都会存在这个文件下的下级文件夹,一般我会将其分组为公司,管理,项目,产品,日常,总结等二级文档,如果还有二级扩展,会在工作收纳箱中继续创建。
## **1.3个人收纳箱**
个人收纳箱主要用于存放个人相关的知识文档,一般会围绕成长,学习,课程,文章,协作等方向进行二级文档创建,同样,如果还有其他个人领域开创可以再继续创建二级收纳箱。
# **二、 知识管理实践**
下面,以我搭建的个人知识体系为例,给大家介绍一下使用收纳箱进行知识体系搭建,如下图。
我个人的收纳箱目前主要有三个,遵循临时收纳箱,工作收纳箱,个人收纳箱。下面是我在腾讯文档这个工具中搭建知识体系的截图。
临时收纳箱:存放临时获取的,有一定价值的知识内容。工作收纳箱:支付,零售,管理,工具,知识,产品。个人收纳箱:成长,学习,读书/书籍,协作,旅行,IP搭建。基于我的三个收纳箱经验分享一下如何使用收纳箱方法进行知识体系的搭建思路。主要包含建收纳箱,填充内容,定期更新。
## **2.1建收纳箱**
第一步:建立临时收纳箱。第二步:建立一级收纳箱(顶层收纳箱)。第三步:建立二级收纳箱(二级和三级)。当然,如果没有三级收纳箱也是可以的。使用收纳箱框架搭建知识体系,提供几点建议。建议一:顶层文件夹不宜过多,最好是根据自己长期需要用到的领域进行创建,但最好不要超过三个,否则会因为过多,在进行知识顶层收纳时不易存放。建议二:二级文件夹一定要独立,一个文件夹就是一个知识领域的文件。建议三:底层文件夹不要超过三层,否则会因为层级过深,不易存放也不易使用。
## **2.2内容填充**
内容填充非常关键,不是说把所有的内容都进行收纳箱存储,一定要基于我们在《方法篇》中分享的面线点方法和知识图谱方法,所有的知识都不应该独立存在,它们一定是相互关联的,因为只有这样,我们的知识体系搭建才有意义,也才能帮助我们更好的补充知识缺陷。
## **2.3定期更新**
在我们进行知识体系填充的过程中,有些知识有可能会存在过时,或者是有一些的新的知识可以替代一些旧的知识,因此,我们在搭建个人知识体系时,一定要学会定期更新。
# 最后的话
最后,简单来做个总结。其实,知识体系的搭建,不在于需要多么复杂的方法论,大家只需要采用收纳箱这个方法,然后遵循面线点和知识图谱的方法论就能轻松搭建自己的知识体系。
# AI有趣图表
> 来源:[https://aigcreative.feishu.cn/docx/MKc0dVzCrozHKvxuILUcAA8pnm4](https://aigcreative.feishu.cn/docx/MKc0dVzCrozHKvxuILUcAA8pnm4)
# 知识库动态
# AI研报书籍论文
> 来源:[https://aigcreative.feishu.cn/docx/ZuEJdX2eTotbEgx2k7dcJL9On9e](https://aigcreative.feishu.cn/docx/ZuEJdX2eTotbEgx2k7dcJL9On9e)
> 2024 AI大事纪
> 由沙粒科技 @AI研究室-帆哥 整理 https://space.bilibili.com/2161614
# 知识库动态
# AI年度报告-2026
> 来源:[https://aigcreative.feishu.cn/docx/LsCBdtq7jo0A11xhMQacoadanxf](https://aigcreative.feishu.cn/docx/LsCBdtq7jo0A11xhMQacoadanxf)
# AI年度报告-2025
> 来源:[https://aigcreative.feishu.cn/docx/PavhdlibfoGAUvxcyyqck4CLnwg](https://aigcreative.feishu.cn/docx/PavhdlibfoGAUvxcyyqck4CLnwg)
# 知识库动态
# 2025-具身智能行业发展研究报告 | 甲子光年智库
> 来源:[https://aigcreative.feishu.cn/docx/QkksdNk1SohLBJxYYh7cM0PonGx](https://aigcreative.feishu.cn/docx/QkksdNk1SohLBJxYYh7cM0PonGx)
> 原文链接: [https://mp.weixin.](https://mp.weixin.qq.com/s/iQAijqNa-wBJar429-2_KQ)qq.com/s/iQAijqNa...
> 公众号:甲子光年
AI的下一个浪潮,正在开始重塑物理世界。
在刚刚过去的2024年,具身智能无疑是科技领域最受瞩目的焦点。全球科技巨头纷纷布局,从OpenAI对Figure AI的战略投资,到特斯拉Optimus的持续迭代升级,再到英伟达积极构建具身智能与人形机器人生态,种种迹象表明,具身智能正处于快速发展的风口。
这一年,具身智能相关技术突破不断涌现。特斯拉Optimus在运动控制和任务执行方面取得了显著进展,展现出强大的迭代速度;Google DeepMind的RT系列模型,基于视觉-语言-动作(VLA)模型的端到端机器人控制学习,大幅提升了机器人的泛化能力,为复杂任务的执行奠定了基础;Figure AI的人形机器人在宝马工厂的成功应用,预示着具身智能商业化落地的可行性正在逐步提升。与此同时,国内的智元机器人、宇树科技、优必选等企业也在积极探索技术创新和商业化路径,并取得了阶段性成果,例如,宇树科技在四足、人形机器人领域持续深耕,推出了面向工业巡检等场景的解决方案;优必选则在人形机器人领域不断探索,其Walker系列机器人在运动控制和人机交互方面取得了显著进展。
从技术层面来看,多模态大模型的兴起为具身智能的发展注入强劲动力。通过融合视觉、语言、触觉、力觉等多模态信息,机器人能够更全面地感知和理解环境,进而做出更精准的决策。同时,世界模型(WFMs)的出现为具身智能的训练和测试提供了新的范式,通过在虚拟环境中进行模拟训练,有效降低了数据采集成本,并有望加快算法迭代速度,部分解决数据稀缺的瓶颈问题。此外,强化学习、模仿学习等算法的进步也为具身智能的发展提供了重要的技术支撑。
具身智能的应用前景广阔,涵盖工业、服务、特种、医疗等多个领域。目前,工业制造场景成为具身智能率先落地的主要领域,在自动化装配、焊接、喷涂、搬运等方面取得了良好的应用效果,如微亿智造等企业已推出面向工业场景的具身智能解决方案。在物流领域,AMR等机器人已广泛应用于仓储物流场景,结合其他上层模块,实现自动化分拣、搬运、配送,显著提高了物流效率。未来,随着技术的不断成熟,具身智能在服务场景,尤其人形机器人在家政服务、陪伴老人、照顾儿童等领域的应用潜力将得到充分释放,有望极大地解放人类劳动力,让人类聚焦更有价值的创造性事务。
在此背景下,甲子光年智库撰写了《2025具身智能行业发展研究报告:具身智能技术发展与行业应用简析》,旨在深入分析具身智能相关技术与应用情况,为智能机器人领域的研究者、决策者、观察者及广大爱好者提供一份全面深入的参考资料。
**报告核心观点:**
+ 具身智能是人工智能与机器人技术的融合,是AI发展的下一个浪潮;
+
+ 具身智能仍处于早期发展阶段,面临数据获取、模型泛化、成本控制、安全伦理等多重挑战;
+
+ 分层模型还是一体化端到端,机器人面临与自动驾驶类似的技术路线选择;
+
+ 工业制造场景是具身智能的先发落地领域,未来将逐步从工业场景的确定性任务走向服务场景的灵活性任务,价值潜力巨大;
+
+ 具身智能的载体形态多样,场景需求决定其最终落地形态;
+
+ 世界模型正在成为具身智能技术进步的“演武场”与“弹药库”。
+
**关**注公众号「 甲子光年 」,后台回复“2025具身智能”,获得高清版完整PDF。或者点击文末“阅读原文”,进入甲子光年官网下载。
# 南方周末2025新年献词|用你的活法定义世界的算法
> 来源:[https://aigcreative.feishu.cn/docx/BBRgd849NoetZ1xyGe0c4iCVnzd](https://aigcreative.feishu.cn/docx/BBRgd849NoetZ1xyGe0c4iCVnzd)
> 原文链接: [https://mp.weixin.](https://mp.weixin.qq.com/s/KiAvmaFlpMjbSI2nrfskCA)qq.com/s/KiAvmaFl...
> 来源-公众号:南方周末
**▲ **制图/赖子欢(部分素材由AI生成)
> 用你的活法定义世界的算法,将你的真实汇成世界的真相,真正点亮黑夜的并不只有太阳,还有内心的火、眼中的光。
当无人驾驶的汽车从你身边闪过,当大模型“写好”你的年终总结,当光影魔法“复活”你的亲人,当虚拟“爱人”向你提出分手……
多年以后,当你回忆2024,生活的海面上,已浮现明日世界的冰山一角。你经历的那些改变,都在确认一场加冕。
生成式AI快速迭代,人机对话上演“物我两忘”;诺贝尔奖连番垂青AI,机器人被注入“灵魂”;俄乌的战场上、加沙的瓦砾里,AI系统在搜寻血肉之躯;预测蛋白质和基因结构,AI模型又助力人类“长命百岁”。
中国没有缺席这场加冕。百模大战,智能体涌现;脑机接口试验成功,AI辅诊纳入医保;传统制造在摆脱重复劳作,千年古建被写入“黑神话”。
(视觉中国/图)
这一年,AI更加强大,以前所未有的速度嵌入各行各业;这一年,AI更多风险,从人类安全、伦理,蔓延至社会的方方面面。
技术狂飙的欣喜与奥本海默式焦虑接踵而至。AI“教母”呼吁,要像“登月计划”一样推动它发展。诺奖得主担忧:“比我们更智能的系统终将控制一切”;联合国通过监管人工智能的“里程碑”决议,欧盟批准首个AI监管法案;《人工智能全球治理上海宣言》呼吁:“在人类决策与监管下,以人工智能技术防范人工智能风险”。而在全球AI中心、大洋彼岸的加州,首次提出防止大模型对人类造成“严重伤害”的监管法案,却遭到了否决……
争议仍在持续,但“奇点”正在来临。看吧,OpenAI并不open,偏见垒起高墙;“驴象之争”落定,技术海沟深潜;机器在模拟人、超越人的道上一路狂奔,人却依然在为生存与日常踯躅蹒跚。
从远古走来,我们曾用燧石敲出火种,用蒸汽顶开束缚,用钨丝点亮暗夜,用网络消弭距离,却从未如此面对“人与工具”的二律背反:
不眠不休的机器极大提升着效率,也无情刷新着劳动价值的版图。当一技之长的护城河渐成小溪,无数普通劳作者将如何开辟新的领域?
海量资源推动着信息平权,也制造着新的鸿沟。在人人都成为“知识容器”的一刻,如何保持智识的独特与人性的温暖?
算力和数据提速着认知与决策,也拨动着心灵中公平正义的天平。若将一切抉择都交给算法,人的精神与觉醒是否面临荒芜?
如果机器可以从事一切工作、治疗一切疾病、抵达一切远方、对抗一切时间,人类作为创造者,登临那造物之巅,看到的究竟是创世纪的朝霞还是终结者的余晖?
迭代进化的洪流,湮没着无数往昔。有时这世界就像一个庞大的系统,你对人生所有的规划与努力,或许都抵不过时代洪流一次不容分说的安排。但我们终究无法接受,在未来的某一天,人工智能回顾“我们”,就像我们回顾寒武纪海洋中的三叶虫、侏罗纪丛林里的恐龙。生而为人,就绝不甘为无角色的NPC,总期望在这个世界找到那个真正的自己。
2024年高考期间,广州市一名考生微笑着走进考场。(南方周末记者 翁洹/摄)
在彷徨中寻找、在跌撞中摸索、在进击中演化,是生命的常态。世界广袤,不是每只方舟都能渡尽所有,可每个生于平凡的人,都在那“日复一日”的度过中苦苦寻觅:无数次刷过那些卷子才走进大学,无数次鼓足那股勇气才向你表白,无数次蹚入那条河流才游到彼岸……历史不是文学家笔下的修辞,而是无数重复又动人的真实故事:虽说前途未卜,但总怀着懵懂的希望。
极致的赋能,令一切“在场”都有“离场”之虞。但每个渺小的个体,都能写下大时代中的愿望与倔强。程序正在得出最精准的结果,可生命不是通往结局的直行线,那其中,应有你百转千回、一咏三叹的人生印记。
要做系统的变量,让存在具有意义。
像一粒火星带来一次绽放,像一只蝴蝶扇动一场飓风。未来不是既定的结局,每个人都可以参与它的塑造;参差不是主线的分支,每条线都可能写出新的章节。
人的抉择,不是程序接收的指令,而是自我的觉知与他者的共情。经历命运的无常,你在力挽狂澜;看到弱者的无助,你正奔走呼告。在枯鱼涸辙时坚守底线,在斗转星移时保持清醒,在人机交互时感受心跳:你没有程序般的标准答案,却始终懂得什么是爱、什么是恨、什么是长夜的痛哭和隐约心头的小确幸。
人创造工具,人从来不是工具。面对机器的高效,面对AI的全能,生命的价值与尊严所以存在,仅仅因为我们是人——因生活而坚忍不拔的人,因梦想而起舞燃烧的人,因相信而赤诚勇敢的人,因挚爱而舍身忘我的人。
因为“它”无懈可击,“你”才意义涌现,人生从来就不是一次次“建模”:AI高速运算,你毅然抉择;AI排遣心事,你伸出援手;AI给出建议,你拼尽全力。用你的活法定义世界的算法,将你的真实汇成世界的真相,真正点亮黑夜的并不只有太阳,还有内心的火、眼中的光。
每一次黎明璀璨,总有人星夜来迎。是他们在马路上川流不息、在格子间凝神贯注、在田野中播下谷种,也是他们用肩膀扛起家庭、把背影投入风雨、以微笑眺望希冀。文明的壮丽绝不仅止于任何器物的如日中天,终将归于每个人的梦想、成长与求变,终要在爱与责任中折射出人之光辉:哪怕浪潮汹涌,始终跌跌撞撞,却总在拼尽全力游向心的方向。
新年的阳光会如约而至,它照耀着每个与众不同的人。这个世界不会因为技术变得简单,复杂才是它的本质,我们也终将在这复杂中找到存在的意义。因为你无法计算,所以无可估量;因为你并不完美,反而独一无二——这是我们对人与AI关系的反思,更是对人类价值的再次确认。我们之所以在这颗星球上行走,不是为了成为最快最好的机器,而是要在这浩瀚的星辰大海中找到自己、确认自己、喜欢自己。
祝你新年快乐!
2024,AI狂飙。很多人、很多事都发生了改变。南方周末2025新年献词聚焦AI,更关注变化背后的你和我。
# 请回答 2025丨印象最深的 AI 技术突破是什么?
> 来源:[https://aigcreative.feishu.cn/docx/KRnWdev5koeL70xwH7DcRSHJnyd](https://aigcreative.feishu.cn/docx/KRnWdev5koeL70xwH7DcRSHJnyd)
> 公众号:特工宇宙
> 链接:https://mp.weixin.qq.com/s/AMD54juGaKDGSalC3N51iw
# 2025中文网百大AI应用
> 来源:[https://aigcreative.feishu.cn/docx/T12edoNhFoFzu7xtUqTcfaL7nYe](https://aigcreative.feishu.cn/docx/T12edoNhFoFzu7xtUqTcfaL7nYe)
> By 图灵的猫
# 知识库动态
# BOND-Trends_Artificial_Intelligence-深度解读
> 来源:[https://aigcreative.feishu.cn/docx/ZnbldoZsHoGso6x5v9ZcRFUDnZe](https://aigcreative.feishu.cn/docx/ZnbldoZsHoGso6x5v9ZcRFUDnZe)
> 报告原文:[Trends_Artificial_Intelligence.pdf](https://aigcreative.feishu.cn/wiki/O7jfwvT3xiAeZukKKxfczVFynuW)
> 解读:创意猎人
# 引言:BOND Capital、“互联网女王”与AI新篇章
在科技投资界,BOND Capital 以其对颠覆性技术趋势的敏锐洞察而闻名。这家由传奇风险投资家、“互联网女王”玛丽·米克尔(Mary Meeker)联合创立的成长型股权公司,延续了米克尔在凯鹏华盈(Kleiner Perkins)及摩根士丹利期间,每年发布备受瞩目的《互联网趋势》(Internet Trends)报告的传统。这份报告曾是全球科技行业、投资者和创业者每年翘首以盼的“圣经”,以其海量的数据、精炼的图表和深刻的洞见,精准地捕捉了互联网时代的脉搏。
随着人工智能(AI)浪潮以前所未有的力量席卷全球,成为继互联网之后又一塑造未来的关键技术,BOND Capital 及其团队将目光投向了这一新兴领域。2025年5月30日,BOND发布了其最新的重磅研究——《趋势 – 人工智能 (AI)》(Trends – Artificial Intelligence (AI))报告。这份报告的诞生,标志着米克尔及其团队将其深厚的趋势分析能力,从互联网领域延伸至人工智能这一更具变革潜力的新大陆。报告旨在系统性地梳理和呈现与AI相关的基础性发展趋势,从最初一系列分散数据点的收集,逐步演变成一份内容庞杂、细节丰富的综合性分析,其编纂过程本身也反映了AI领域数据迭代的迅猛以及其内在的复杂性。这份报告不仅是对当前AI发展现状的全面扫描,更是对未来趋势的深刻预判,为我们理解这场正在发生的、由AI驱动的全球性变革提供了宝贵的框架和数据支撑。
# 报告核心洞察:图表勾勒AI发展全景
报告在引言部分便通过一系列极具冲击力的数据图表,直观地勾勒出AI发展的核心趋势,揭示了AI技术演进所带来的前所未有的变革速度与广度。研究表明,AI的用户基数和使用频率的增长态势,其迅猛程度已远超早期互联网的普及速度,甚至机器本身的学习和进化能力也展现出超越人类认知处理速度的潜力。这种由AI驱动的变革浪潮,其影响绝非仅仅局限于技术层面,而是深刻地渗透并重塑着金融市场、社会结构、物理世界乃至全球地缘政治的现有格局。
+ **开发者生态系统的蓬勃发展**:数据显示,领先芯片制造商(如NVIDIA)的生态系统内,开发者数量预计将从2005年的基数(约数万)增长至2025年的600万,年均复合增长率(CAGR)高达30%。这为AI技术的创新与应用奠定了坚实的人才基础。
+ **用户增长速度的惊人对比**:以领先的美国大型语言模型(LLM)为例,其在推出后的短短两年内(图表显示LLM在第二年即达到目标,而互联网则花费了23年),其在北美以外地区的总用户渗透率便达到了90%。相比之下,互联网达到同等渗透水平耗费了长达23年的时间。这一对比鲜明地展示了AI技术及其应用采纳速度的空前性。
+ **资本支出的爆炸性增长**:美国六大科技巨头(苹果、英伟达、微软、Alphabet、亚马逊AWS、Meta)在AI领域的资本支出(CapEx)从2014年的330亿美元,急剧攀升至2024年的2120亿美元,年均复合增长率高达21%。这一数额的增长,不仅体现了绝对值的巨大,更反映了科技领军企业对于AI基础设施建设的坚定投入和战略决心。
+ **AI与物理世界融合的加速**:在旧金山,自动驾驶出租车服务提供商(如Waymo)的市场份额在短短20个月内(从2023年8月至2025年4月)便从几乎为零增长到了27%。这不仅是一个具体案例的成功,更是AI技术在交通、物流等物理世界应用场景中快速落地并产生实际影响的缩影。
+ **全球用户增长的同步性**:从2023年5月到2025年4月,领先的美国LLM应用程序的月活跃用户数(MAU)在全球各大主要地区,包括撒哈拉以南非洲、南亚、北美等,均实现了显著增长,显示出AI技术的全球吸引力和渗透力。
+ **AI对就业市场的深刻重塑**:数据显示,从2018年1月到2025年4月,美国与AI相关的IT职位发布数量激增了448%,而同期非AI相关的IT职位数量则呈现下降趋势,降幅为9%。这一升一降清晰地揭示了AI技术正在深刻改变劳动力市场的需求结构。
核心观点概览:一个前所未有的变革时代
+ **前所未有的变革时代**:当前世界正经历着由技术创新,特别是AI技术驱动的,速度和广度均前所未有的变革。AI的飞速发展,与日俱增的计算能力以及日益便捷的全球资本流动相结合,共同推动着规模宏大的社会经济转型。
+ **AI的即时全球影响力**:与互联网1.0时代技术主要从美国逐步向全球扩散的模式不同,以ChatGPT为代表的AI应用,自问世之初便迅速突破地域限制,几乎同步地影响了全球绝大多数地区,展现出强大的全球辐射能力。
+ **激烈的竞争格局**:无论是传统的科技平台巨头,还是新兴的AI挑战者,都在积极竞逐,致力于构建和部署下一代AI基础设施。在这一过程中,技术力量与地缘政治因素日益交织,AI领域的领导地位甚至可能直接决定未来的地缘政治影响力。中美两国在此领域的竞争尤为引人注目,其激烈程度和战略意义堪比历史上的“太空竞赛”。
+ **机遇与不确定性并存**:AI的迅猛发展无疑带来了巨大的发展机遇,但同时也伴随着前所未有的不确定性和潜在风险。尽管如此,报告对AI的长期发展前景仍持乐观态度。这种乐观情绪植根于对激烈竞争驱动创新、计算能力日益普及、全球范围内对AI技术的快速采纳以及审慎周全的领导力能够共同促进一种“相互确保威慑”(Mutually Assured Deterrence)状态形成的预期,从而在一定程度上规避极端风险。
+ **“游戏已经开始”**:报告以明确的判断指出,围绕AI的全球竞赛“游戏已经开始”,尤其是在美国和中国的科技巨头引领下,这场关乎未来的角逐正紧锣密鼓地展开。
**引言部分的深层启示**
1. **变革的加速度特征日益凸显**:报告不仅强调当前变化速度之快,更通过对比AI与互联网的发展轨迹(互联网时代的变革已堪称“狗年”般迅猛,而AI用户与使用趋势的增长则“显著更快”),以及机器自身学习能力的进化(机器超越人类的进化速度),揭示了“变化正在加速”这一更深层次的趋势。这种变化并非匀速的快,而是呈现加速度,即变化的速度本身也在加快。这对企业和个人的适应能力、预测能力和战略调整的灵活性都提出了前所未有的高要求。
1. **资本的战略性转向已成定局**:大型科技公司对AI领域的巨额资本支出,并非简单的技术投资,而是在新的技术浪潮面前,采取的一种攻防兼备的战略姿态。它们利用雄厚的“巨额自由现金流”,“越来越多地导向AI”,其核心目标在于“推动增长并抵御攻击者”。面对在创新、产品迭代等方面“尤其积极”的新兴AI公司,传统巨头必须通过大规模资本投入来巩固和拓展其在下一代技术平台上的主导权,防止被颠覆性创新所边缘化。AI已然成为科技巨头们的核心战略战场和维持市场领导地位的关键。
1. **地缘政治的科技化趋势日益显著**:AI的发展已超越单纯的商业竞争,上升到国家战略层面,AI技术的领先与否,正日益直接地与国家的地缘政治影响力挂钩。报告明确指出,“技术和地缘政治两股强大力量日益交织”,并将Meta首席技术官Andrew Bosworth关于中美AI竞争如同“我们的太空竞赛”的论断置于显要位置。其核心判断在于“AI领导力可能带来地缘政治领导力,而非相反”。这意味着,在AI技术领域取得领先地位的国家,将可能在未来的国际事务中掌握更大的话语权和影响力,国家间的AI竞赛因此将变得异常激烈和关键。
# 第一章:变革是否比以往任何时候都快?是的,确实如此
本章节深入探讨了当前由人工智能驱动的变革速度是否超越了以往任何时期,并得出肯定的结论。通过对技术复利效应的分析和知识传播演进的回顾,本章为这一论断提供了坚实的数据支撑和逻辑论证。
技术复利 (Technology Compounding) 的力量
技术的发展并非线性累加,而是呈现出一种“复利”效应,即每一代技术的进步都建立在先前技术的基础之上,并以更快的速度推动下一轮创新,从而形成指数级的增长态势。
+ 从历史视角看,全球GDP的增长曲线与一系列重大技术突破(如印刷机、蒸汽机、电力、晶体管、个人电脑、互联网、智能手机和云计算)的出现高度吻合。这清晰地表明,技术创新是驱动经济社会发展的核心引擎,且其影响力随着时间的推移不断增强。
+ 计算周期的演进是技术复利的直观体现。从早期的大型计算机(百万单位级别)到小型计算机,再到个人电脑的普及(约3亿单位)、桌面互联网时代的到来(超10亿用户)、移动互联网的兴盛(超40亿单位),直至今日我们迈入的AI时代(预计将连接数百亿单位的设备),计算设备的规模和渗透率均呈指数级增长。这种计算能力的泛在化,为AI技术的广泛应用和深度发展奠定了坚实的基础。
+ 在AI领域内部,技术复利的表现尤为突出:
+ AI模型训练数据规模的爆炸性增长:用于训练AI模型的关键数据集(以词汇量衡量)从1950年到2025年,实现了年均复合增长率高达**260%**的惊人增长。海量、多样化的数据是AI模型学习和能力提升的“燃料”,其指数级增长直接驱动了AI性能的飞跃。
+ **AI模型训练计算需求的急剧攀升**:**相应地,**关键AI模型的训练所需的计算量(以FLOP为单位)从1950年到2025年,年均复合增长率更是达到了令人瞩目的360%。这反映了模型复杂度的提升,也持续推动着对更强大算力的极致追求。
+ **算法效率提升的显著贡献**:从2014年到2023年,算法的改进对AI模型性能的提升贡献了相当于年均**200%**的等效计算能力增长。这表明通过更智能的算法设计,可在有限硬件资源下实现更高计算效率。
+ **强大AI模型数量的快速增加**:从2017年到2024年,新发布的大规模AI模型(训练计算量超过 10²³ FLOP)数量实现了年均**167%**的增长。这反映了AI技术迭代速度加快和市场能力供给日益丰富。
+ **ChatGPT的现象级增长**:截至2025年4月,其全球用户数已突破8亿,付费订阅用户达到2000万,年化收入高达40亿美元。其年化搜索查询量在短短2年(到2024年底)便达到了3650亿次;而Google搜索达到同等规模则花费了11年。这意味着ChatGPT的增长速度是Google搜索的5.5倍。
+ 这种前所未有的速度,源于AI技术作为一种**“复合器” (compounder)** 的特性。它建立在成熟的互联网基础设施之上,使得易于使用且能满足广泛用户兴趣的AI服务,能够实现“极速采纳” (wicked-fast adoption)。
**知识传播的演变 (Knowledge Dis**tribution Evolution)
回顾知识传播的历史,从1440年古腾堡印刷机的“静态内容 + 物理交付”模式,到信息时代的数字化和网络化,知识的生产、分发和获取方式不断进化。AI的出现,正将这一演变推向新的高潮。AI技术,特别是大型语言模型,正以前所未有的方式加速知识的“堆积”过程,并有可能简化从海量信息中提炼“智慧”的路径,正如Martin H. Fischer所言:“知识是事实的堆积;智慧在于将其简化。”
**第一章的深层启示**
1. 技术栈的协同加速效应是AI飞速发展的根本动力:AI的进步是数据(指数级增长)、算力(持续突破)、算法(不断创新)三大支柱间形成的强大正反馈循环、相互强化、协同作用的结果,直接导致AI模型数量增加、能力提升及应用(如ChatGPT)的现象级普及。
1. AI普及速度的颠覆性预示着社会经济调整期的缩短与加剧:以ChatGPT为代表的AI应用,其用户增长和市场渗透速度远超以往技术,预示AI可能以更快速度渗透社会经济各层面,大幅压缩社会适应期、行业转型期及法律法规制定完善期,对社会治理和应变能力提出严峻考验。
1. **知识获取的民主化与新挑战并存**:AI技术加速知识传播和普及,促进知识获取民主化。但其生成信息的质量、准确性参差不齐,可能加剧信息过载;个性化推荐算法或导致“信息茧房”;AI生成内容的真伪辨别、知识产权、学术诚信等问题,对用户媒介素养、批判性思维及社会监管提出新要求。
# 第二章:AI用户+使用量+资本支出增长 = 前所未有
本章节将深入剖析人工智能(AI)在用户规模、使用频率以及相关资本支出(CapEx)方面所呈现出的空前增长态势。
**AI用户与使用量增长的空前性**
领先的美国大型语言模型(LLM)在全球用户中的渗透速度,显著超越了早期互联网的发展轨迹。以ChatGPT为例,其周活跃用户(WAU)在极短的时间内便攀升至数亿级别。AI模型训练所需的数据集规模(以Token计量)正以惊人的速度扩张,从2010年6月到2025年5月,AI模型训练数据集的Token数量以年均**250%**的速度增长。Token数量的增加有助于提升模型性能和泛化能力。
大型科技公司在AI领域的资本支出 (CapEx)
+ “六大”美国科技公司的CapEx动态:包括苹果、英伟达、微软、Alphabet、亚马逊AWS和Meta在内的六大巨头,2024年合计资本支出达2120亿美元,较2023年大幅增长63%,与ChatGPT WAU同期增长约200%呈现高度同步性。从2014年到2024年,这六大公司的CapEx年均复合增长率达到21%。更为关键的是,CapEx占这些公司总收入的比例,也从2014年的8%稳步攀升至2024年的15%,表明AI相关投入在其战略中权重日益增加。
+ **亚马逊AWS的CapEx模式**:AWS的CapEx占其收入的比例在2024年达到了惊人的49%,远高于2018年云计算基础设施建设相对成熟时期的4%,甚至超过了2013年初期的27%。这强烈暗示由AI及机器学习(ML)基础设施建设需求驱动的新一轮大规模资本投入周期可能已经重启。
+ **科技巨头的雄厚财力支撑**:过去十年(2014-2024年),“六大”科技公司的自由现金流(FCF)总额增长了263%,达到3890亿美元。同期,其持有的现金及现金等价物总额也增长了103%,达到4430亿美元,为大规模AI投入提供了坚实财务保障。
+ 研发投入 (R&D) 亦同步高速增长:“六大”科技公司的研发支出总额占其收入的比例,从2014年的9%上升到了2024年的13%,期间的年均复合增长率达到了20%。
CapEx增长的驱动因素与受益者
+ **GPU性能的巨大提升与效率优化**:以NVIDIA为例,其GPU产品性能在八年内(Pascal到Blackwell系列)实现了高达225倍的提升,同等算力所需GPU数量减少4倍。在一个理论上的10亿美元规模数据中心中,采用最新GPU技术,推理Token容量相较八年前提升27,500倍,理论Token年收入潜力提升30,000倍,数据中心整体功耗下降43%,单位能源效率(每兆瓦时处理Token数)惊人提升50,000倍。
+ NVIDIA GPU算力存量的指数级增长:全球NVIDIA GPU提供的总计算能力在过去约六年时间里实现超100倍增长,年均复合增长率高达130%。NVIDIA成为AI浪潮核心受益者,其数据中心业务收入在全球数据中心CapEx总额中占比2024年已达25%。
+ AI模型训练与运行的计算支出是主要驱动力:单个先进模型训练费用超1亿美元,Anthropic CEO Dario Amodei预测未来(2025年后)训练成本可能达100亿甚至1000亿美元。尽管推理单位成本下降,但AI应用使用量爆炸性增长,总体推理支出预计将远超训练支出。
+ 数据中心成为AI CapEx的关键受益领域:全球IT公司数据中心CapEx在2024年已达4550亿美元。美国数据中心年化私人建设价值过去两年年均增长49%。新建或在建数据中心容量(以兆瓦计)在美国主要市场过去四年增长16倍,远超已运营容量5倍的净增量。建设速度不断刷新纪录,如xAI在孟菲斯建75万平方英尺的Colossus超算中心仅用122天,GPU数量7个月从0增至20万块。数据中心电力消耗巨大,2024年占全球总电力消耗约1.5%,自2017年来年均增长约12%,是全球总电力消耗增长率四倍以上。
**第二章的深层启示**
1. 一场围绕AI基础设施的“军备竞赛”正在大型科技公司之间激烈展开:巨额且不断增长的CapEx,核心目标是构建未来AI生态系统主导地位,形成技术和资本壁垒,获取算力优势以在AI产品和服务性能、成本、迭代上全面领先。
1. AI领域高资本支出占比的可持续性及其投资回报周期成为关注焦点:AWS的CapEx占比高达49%,暗示AI基础设施资本密集程度远超传统云计算。AI模型训练成本持续上升,推理总支出巨大,而商业变现模式仍在探索,投资回收周期长且面临技术贬值风险。
1. 能源消耗正日益成为AI发展的潜在瓶颈:数据中心电力消耗快速增长对全球能源基础设施构成压力。电力可用性正成为日益重要的制约因素,解决AI能源挑战是其持续健康发展的核心议题。
# **第**三章:AI模型计算成本高昂/持续上升 + 每Token推理成本下降 = 性能趋同 + 开发者使用量上升
本章节聚焦于AI模型经济学中的核心动态:训练先进AI模型计算成本持续高企,而运行模型进行推理的每Token成本却急剧下降,深刻影响着AI模型性能格局、开发者选择及整个AI生态。
AI模型训练成本与推理成本的鲜明对比
+ **训练成本:高昂且持续攀升**:训练前沿LLM已成人类史上最昂贵、资本最密集的科研工程活动之一。模型参数规模扩大和架构复杂性增加,使训练成本从数百万美元升至数亿美元。Anthropic CEO Dario Amodei在2024年6月预测,已有模型训练成本近10亿美元,未来(2025-2027年)或出现成本达100亿甚至1000亿美元的模型。从2016到2024年,前沿AI模型估计训练成本增长约2400倍。
+ 推理成本(每Token):急剧下降:得益于硬件技术飞速进步(NVIDIA Blackwell GPU (2024) 每Token能耗较Kepler (2014) 降105,000倍)和算法效率持续优化。斯坦福HAI数据显示,从2022年11月到2024年12月,面向客户的每百万Token AI推理价格平均下降99.7%。
**对模型性能和开发者采用率的影响**
+ 性能趋同 (Performance Converging):尽管训练顶级AI模型成本高昂,但不同提供商的前沿模型在许多常见基准测试和实际应用任务上性能正迅速趋于一致,如LMSYS Chatbot Arena数据显示顶尖LLM性能评分差距缩小。这使得通过单纯追求更高性能参数实现差异化难度加大,或加速AI基础模型“商品化”。对许多应用场景,顶级闭源大模型与更小、高效或优化开源模型间实际性能差异可能已微不足道。
+ 开发者采用率上升 (Developer Usage Rising):推理成本急剧下降和模型性能相对趋同,极大激发开发者创新活力和AI技术采用热情。
+ 低成本驱动实验和创新,迭代速度加快,为几乎所有开发者提供了将AI能力产品化的可行性。
+ 模型选择灵活性增加,开发者可根据需求和预算选择性价比更高方案,如低成本API或本地部署微调开源模型。
+ 多平台选择(OpenAI、Meta Llama、Mistral AI、Anthropic Claude、Google Gemini等)有效避免供应商锁定,削弱单一供应商定价和市场控制力。
+ 开发者生态“飞轮效应”显现:开发者越多,生态越繁荣,吸引更多开发者,形成正向反馈。
+ 数据佐证:专业开发者AI工具使用率从2023年44%升至2024年63%;学习编程人群中达44%。GitHub上AI相关高关注度代码库数量16个月(2022.11-2024.3)增约175%。Google云平台月处理Token数同比增50倍(2025.5达480万亿)。Microsoft Azure AI Foundry季度处理Token数同比增5倍(2025Q1达100万亿)。
Jevons悖论在AI领域的体现
AI领域发展似乎印证“杰文斯悖论”:技术进步提高资源使用效率(GPU能效提升,推理单位成本下降),但成本降低刺激需求增长,反而导致该资源(AI计算能力和相关能源)总消耗量增加。
**第三章的深层启示**
1. AI价值链的利润分配面临严峻挑战:模型训练成本“摩尔定律向上”与推理成本“摩尔定律向下”的对比,给AI基础模型提供商带来巨大盈利压力。高昂研发训练投入需通过大规模推理服务摊薄回收,但推理服务市场价因竞争和技术效率提升不断压缩。利润可能更多向上游硬件供应商(如NVIDIA)和下游应用层开发者或服务集成商集中,基础模型提供商或面临“商品化陷阱”。
1. 开发者已成为驱动AI生态发展的核心力量:推理成本下降和模型可及性提高,赋能全球开发者,他们成为AI应用创新和生态构建主力。各大AI平台和模型提供商竞争已演变为对开发者注意力和生态贡献的争夺。赢得开发者青睐并形成繁荣生态的平台更可能胜出。
1. 市场需求正推动AI模型从“大而全”的通用模型向“小而美”的专用模型演化:通用大模型(如GPT-4)推动技术边界,但其高昂成本和在特定场景下可能“性能过剩”,催生了对更小、经济、针对特定用例深度优化的专用模型的需求。未来AI市场或呈现通用模型与众多专用模型共同构成的多样化、定制化复杂生态。
# 第四章:AI使用量 + 成本 + 亏损增长 = 前所未有
本章节旨在深入探讨人工智能(AI)发展过程中独特的财务状况,其特点是用户使用量、相关成本以及在某些情况下的运营亏损均呈现前所未有的增长态势。
**AI发展的财务挑战与历史借鉴**
报告开篇指出科技行业常见的“危险信号”论调(如“这次不一样”、“靠规模效应盈利”),这些说法虽预示风险,但也曾是孕育亚马逊、谷歌、Meta、特斯拉等巨头的摇篮。当前AI领域的独特性在于:众多由创始人驱动、市值已达万亿美元级的科技巨头(英伟达、微软、亚马逊、谷歌、Meta、特斯拉等),它们大多毛利率超50%、现金流充裕,却在同一全球市场激烈争夺AI机遇。同时,中美高科技竞争白热化。Alasdair Nairn在《驱动市场的引擎》中回顾技术颠覆周期:从乐观狂热到资本聚集,再到残酷竞争,最终分出赢家输家。任何需巨额CapEx的技术,早期若未能建立有效竞争壁垒,即便最终成功,也常面临投资回报令人失望的风险。
**AI相关变现案例**
+ **芯片 (Chips)**:
+ NVIDIA:AI GPU领导者,季度收入(FQ4:25,即2025年1月底财季)同比增78%达390亿美元。过去十年总收入增28倍,远超“六大”科技巨头研发与CapEx总和6倍的增长。
+ Google TPU:年销售额快速增长,摩根士丹利估计2024年同比增116%达89亿美元。
+ Amazon AWS Trainium:AI训练芯片,摩根士丹利估计2025年年销售额同比增216%达36亿美元。
+ 计算服务 (Compute Services):
+ CoreWeave:GPU云服务公司,2024年收入同比增730%达19亿美元。
+ Oracle:AI基础设施相关收入两年增50倍,F2024财年达9.48亿美元。
+ Astera Labs:高速互联解决方案,2024年收入同比增242%达3.96亿美元。
+ Tesla:自研AI训练超算Dojo,AI训练能力(等效NVIDIA H100数)33个月增8.5倍。
+ 数据层 (Data Layer):
+ Scale AI:AI数据标注与评估领导者,2024年收入同比增160%达8.7亿美元。
+ VAST Data:AI高性能数据存储、管理、处理,成立六年多累计软件销售额(截至2025.5)从0增至20亿美元。
**AI公司的收入与成本/亏损对比**
+ **OpenAI**:收入爆发式增长,但AI模型训练运行投入巨大,计算支出急剧上升。报告图表显示,2023-2024年其预估收入与计算支出间差距(潜在运营亏损)依然显著,商业模式可持续性面临计算成本考验。
+ 微软/亚马逊/Alphabet/Meta:这些巨头AI收入增长可观,但大规模CapEx对自由现金流(FCF)利润率造成压力。2023-2024年:微软CapEx增58%,FCF利润率从30%降至27%;亚马逊CapEx增57%,FCF利润率从6%微降至5%;Alphabet CapEx增63%,FCF利润率从23%降至21%;Meta CapEx增38%,FCF利润率维持33%(但前期投入已巨大)。
**AI公司的投资和估值情况**
当前AI领域呈现“高收入增长、高现金消耗、高估值、高投资水平”并存景象。对消费者利好,对投资者则机遇与风险并存。
+ 部分私营AI模型公司财务概览 (截至2025年5月13日):
+ OpenAI:年化收入估92亿美元,累计融资63亿美元,最新估值3000亿美元,估值/收入倍数约33倍。
+ Anthropic:年化收入估20亿美元,融资180亿美元,估值615亿美元,约31倍。
+ xAI:年化收入远超1亿美元,融资121.3亿美元,估值800亿美元。
+ Perplexity:年化收入估1.2亿美元,融资14.1亿美元,估值90亿美元,约75倍。
+ **OpenAI估值与可比公司对比**:OpenAI企业价值/未来12个月收入倍数(截至2025.5)约20倍,远高于Duolingo、Meta、Spotify等公众公司6.9倍中位数。其每用户年收入(ARPU)估约40美元(或$12,基于不同估算),与可比公司23美元中位数尚在合理区间。
+ **历史的启示与未来的不确定性**:报告回顾苹果(1997年濒临破产)、亚马逊(2000年互联网泡沫危机)、谷歌(2004年IPO时巨额CapEx引质疑)、Uber和特斯拉(盈利前漫长烧钱)等案例,表明颠覆性创新常伴随早期高投入高风险。这些巨头最终靠产品卓越性和大规模数据驱动的网络效应胜出。AI公司能否复制其路径,将高投入亏损转化为可持续盈利,仍是未知数。
AI变现可能性:新进入者 vs. 科技巨头
+ **消费者AI变现**:
+ **新进入者(AI原生公司)策略**:通过订阅模式(OpenAI ChatGPT、xAI Grok、Google Gemini、Anthropic Claude、Perplexity等)和开发者API费用变现。收入增长惊人:OpenAI年收入据称增1050%达37亿美元;Anthropic年化收入18个月增20倍达20亿美元;Perplexity年化收入14个月增7.6倍达1.2亿美元;Glean年化收入24个月增10倍达1亿美元。Stripe数据称AI公司达500万美元ARR速度比SaaS公司快35%。
+ **科技巨头策略**:利用数以十亿计用户基础(Meta旗下应用超34亿,苹果活跃设备超23.5亿,Google多个10亿级用户产品)和成熟分发渠道,广泛集成AI功能或推独立应用。AI产品/功能广泛落地:Canva AI功能使用数十亿次;Spotify AI DJ推广至60+市场;Microsoft Copilot累计聊天150亿次;Meta AI MAU近10亿;X平台Grok AI访问量激增;Google Gemini应用生态MAU 4亿,AI Overviews MAU 15亿;Amazon推AI购物助手Rufus;TikTok推Symphony AI助手;Apple发布Apple Intelligence。财务贡献显著:微软AI相关业务年化收入超130亿美元,同比增175%;xAI年化收入2025年大幅增长;Palantir美国商业客户数同比增65%达432家。
+ 企业AI变现:水平平台 vs. 专业软件:
+ **水平企业平台竞争**:SaaS巨头(微软GitHub Copilot/M365 Copilot, Adobe Firefly, Atlassian Intelligence, Zoom AI Companion, Canva Magic Studio, Salesforce Agentforce等)将AI能力(常以“Copilot”形式)深度集成到成熟产品线。用户数和使用量快速增长:Microsoft GitHub Copilot用户和收入持续增长;CIO对M365 Copilot预期使用率上升;Adobe Firefly生成内容超200亿个;Atlassian Intelligence MAU超100万;Zoom AI Companion激活账户数快速增长;Canva Magic Studio AI工具使用超160亿次;Salesforce Agentforce上线90天签约3000付费客户。LLM挑战者(如OpenAI ChatGPT Enterprise)试图构建一体化企业智能平台,用户覆盖超80%财富500强。
+ **AI赋能的专业软件崛起**:在软件工程(Anysphere Cursor ARR 25个月从100万至3亿美元)、产品开发(Lovable ARR 5个月增13倍达5000万美元)、医疗保健(Abridge CARR约5个月从5000万至1.17亿美元)、法律服务(Harvey ARR 15个月从1000万至7000万美元)、客户服务(Decagon ARR一年从约100万至1000万美元)、金融服务(AlphaSense ARR两年从约1.5亿至约4.2亿美元)等领域涌现高增长AI初创。
+ **AI新应用前沿广阔**:包括药物发现(AI模型参数规模4年CAGR 290%;Google DeepMind AlphaFold使预测蛋白质结构数扩张1000倍)、精密制造、机器人、自主科研、供应链优化、网络安全、个性化教育、自主金融、环境监测、能源管理等。
**第四章的深层启示**
1. AI领域的投资热潮中,“泡沫”与“真实价值”的辨析成为核心议题:当前AI初创公司普遍高估值、高投入、高亏损,与历史泡沫期相似。其能否最终建立可持续商业模式和强大竞争壁垒,将高投入和亏损转化为未来真实自由现金流,是关键。
1. AI的变现路径呈现出多样性,但每个赛道都面临着白热化的竞争:无论是硬件、计算服务、数据服务,还是面向消费者或企业的AI软件平台,均挤满新旧玩家,竞争异常激烈。大型科技公司具天然优势,初创则寻求差异化。
1. 企业级AI市场呈现出“赋能”与“颠覆”并存的双重发展逻辑:现有SaaS巨头用AI“赋能”现有产品(如微软Copilot系列),而AI原生初创则试图利用AI“重塑”甚至“颠覆”传统工作流和软件模式(如OpenAI ChatGPT Enterprise;垂直领域Anysphere Cursor等),共同塑造全新企业软件服务格局。
# 第五章:AI变现威胁 = 竞争加剧 + 开源势头 + 中国崛起
尽管人工智能(AI)的商业化前景广阔,但也面临着日益严峻的挑战。本章节将深入探讨影响AI变现潜力的三大主要威胁:竞争全面加剧、高性能开源模型兴起、中国在AI领域的迅速崛起。
日益激烈的竞争:多模态模型发布与市场白热化
+ **多模态AI的兴起与演进**:AI模型已从主要处理单一数据类型(如文本,代表有GPT-3、Llama-1)迅速演进到能同时理解和处理多种数据模态(文本、图像、音频、视频等)的多模态AI。如OpenAI的CLIP (2021)、Meta的ImageBind (2023) 和Chameleon (2024),以及2024-2025年的GPT-4o、Claude 3等,具备全面多模态处理能力,极大提升AI实用性和交互体验。
+ **模型发布数量的爆炸性增长**:过去两年,新发布大型多模态AI模型数量增1150%;LLM数量增420%;过去一年,大型视觉模型增109%,大型语音/音频模型增367%,大型视频模型增120%。这种“模型军备竞赛”使市场AI能力供给迅速饱和。
+ **LLM竞争格局**:OpenAI的ChatGPT凭借先发优势和模型能力,在全球网站访问量方面仍保持领先(51亿次月度访问)。但中国新兴力量如DeepSeek(月访问约1.96亿至4.8亿次),以及xAI Grok(月访问约1.96亿至4.8亿次),正迅速崛起构成挑战。
+ **产品发布的空前密集度**:以2025年5月19日至23日一周为例,Google在其I/O大会发布Gemini Live、Project Mariner等系列AI进展。同时,Microsoft(Copilot Studio多代理编排)、Anthropic(Claude Opus 4)、OpenAI(多模态交互实验功能)等也纷纷推出重要更新,表明AI竞争进入白热化。
开源模型的兴起及其对商业模式的冲击
+ **从闭源主导到开源复苏的演变**:现代机器学习早期(约2012-2018)多开源。约2019年起(以OpenAI GPT-2限制权重为标志),开发专有闭源AI模型成趋势,动机包括保护IP、竞争优势及安全考量。闭源模型(GPT-4、Claude系列)资本高度密集,性能领先但内部机制不透明,演变成通过API提供服务的“黑箱”产品。随着LLM技术成熟和竞争加剧,AI领域经历“开源复兴”。开源模型因成本低、灵活性高、可访问性强等优势吸引力日增。Hugging Face等平台极大简化开源模型(如Meta Llama、Mistral AI Mixtral)获取部署流程。中国在大型开源模型发布上表现突出,2025年已发布DeepSeek-R1、阿里巴巴Qwen-32B、百度Ernie 4.5(计划6.30开源)。
+ **开源与闭源模型的对比分析**:闭源模型在消费者MAU和训练计算资源投入上仍占优。但开源模型性能追赶惊人:在MATH Level 5测试中,中国开源模型DeepSeek R1(2025.1发布)准确率93%,接近同期闭源模型o3-mini的95%。Artificial Analysis评测也显示DeepSeek模型在编码、量化推理等多维度表现出色,与顶尖闭源模型不相上下甚至超越。
+ **开发者对开源模型的热情高涨**:Meta Llama系列模型在Hugging Face累计下载量8个月增3.4倍达12亿次(截至2025.4)。Meta CEO扎克伯格预测2025年将是开源模型成开发者主流选择年。Hugging Face托管AI模型数从2022年3月约3.5万个激增至2024年11月116万个,增长33倍。
**中国在AI领域的崛起和深远影响**
+ AI领域的“太空竞赛”与国家战略:报告引用Meta CTO Andrew Bosworth观点,将中美AI竞争比作新“太空竞赛”,AI领先或决定未来数十年全球力量对比。中国政府将AI发展置于国家战略高度,自2015年“中国制造2025”以来能力显著加速,AI已应用于战场后勤、智能目标识别等战略层面。
+ **中美科技与经济博弈的加剧**:AI竞争是两国更广泛科技经济博弈的缩影。两国在稀土、半导体等领域竞争激烈。美国通过《芯片与科学法案》等力图重振本土半导体并构建排除中国的供应链,台湾台积电(TSMC)地位关键。
+ **全球市值领导者格局变迁**:对比1995年与2025年全球市值最高公司榜单:全球总榜,美国公司占比从53%(16家)升至83%(25家),中国公司占7%(2家,腾讯、工行),日本无一上榜。科技公司榜,美国占比从53%(16家)升至70%(21家),中国占10%(3家,腾讯、阿里、中移动),日本亦跌出。台积电虽仅一家,但在全球先进半导体制造占80-90%份额,战略重要。
+ 中国AI技术的快速响应与自主发展:大型AI系统累计发布数方面,美国领先,中国紧随其后远超他国。本土研发模型(DeepSeek R1、阿里Qwen 2.5-Max、百度文心一言4.5 Turbo等)性能快速追赶国际先进水平,2025年初密集发布。Epoch AI研究显示中国部分模型在相对更低训练成本下实现相当性能。面对美芯片限制,中国加速发展本土半导体(如华为向本土客户交付昇腾AI芯片集群)。工业机器人安装使用量全球领先,远超他国总和。
+ **中国消费者对AI的独特使用特点**:本土AI平台主导国内市场。Roland Berger数据显示,中国市场MAU前十AI应用均为本土开发(DeepSeek、Kimi、豆包、文心一言等),均积累数千万用户。DeepSeek移动应用4个月全球MAU达5400万(中国用户占34%)。中国民众对AI益处更乐观,2024年调查83%中国受访者认为AI利大于弊,美国仅39%。
**第五章的深层启示**
1. **AI商业化正面临来自市场竞争、开**源模式和中国崛起这三个方向的“三重挤压”:模型数量激增和性能趋同导致产品差异化难、价格竞争激烈。免费/低成本开源模型以灵活性和成本优势挑战闭源收费基础。中国凭借市场、创新、成本和国家支持成强大竞争力量。这些共同对现有AI公司定价权、市场份额和利润空间构成威胁。
1. 开源模式在AI领域展现出“双刃剑”效应:加速技术普及、创新和生态繁荣,降低门槛。但对投入巨资研发闭源模型的公司,开源盛行或削弱其商业回报独占性。未来AI商业模式可能更依赖优质服务、深度行业定制和强大生态,而非仅靠模型授权或API收费。
1. AI地缘政治中“技术国家主义”的色彩日益浓厚:中美AI竞争已超商业技术范畴,上升至国家战略安全和全球影响力博弈。各国或更强调AI技术自主可控和“技术主权”,可能导致全球AI生态割裂。中美AI竞争类比“太空竞赛”,AI领导力与地缘政治领导力紧密关联。美国对华技术限制及中国强调“自主创新”均是体现。中国AI应用市场高度本土化也印证此趋势。
# 第六章:AI与物理世界的融合 = 快速 + 数据驱动
人工智能的应用早已不再局限于数字虚拟空间,而是以惊人的速度和深度融入并重塑着我们身处的物理世界。本章节将重点探讨AI在物理世界几个关键领域的应用进展。
**AI在物理世界应用的扩展**
报告指出,AI技术正经历从主要赋能数字应用到深度嵌入物理实体(车辆、工业装备、国防系统等)的重大转变。核心标志是“物理智能体”(physical agents)的兴起,它们能感知物理环境、基于AI自主决策并执行物理动作。
自动驾驶领域:从实验到规模化部署
+ **Tesla(特斯拉)**:完全自动驾驶(FSD)beta版本已成持续产生收入的商业化部署。截至2025年3月,搭载FSD beta的车辆在全球累计完全自动驾驶(有驾驶员监控)行驶里程,33个月内实现约100倍增长,总里程超40亿英里。最新FSD v12采用端到端AI方法,用神经网络替代原约33万行传统C++控制代码,实现全链路AI驱动。
+ Waymo(谷歌母公司Alphabet旗下):无人驾驶出租车(Robotaxi)服务在旧金山市场,付费共享出行市场份额(按总交易额)20个月内(2023.8-2025.4)从几乎为零增至27%,证明其技术在复杂城市环境可行性及商业模式初步验证。
+ Applied Intuition:为汽车、卡车、建筑机械、国防装备等提供AI驱动智能化解决方案和开发工具,将自动驾驶和车辆智能软件能力从特定硬件平台抽象。服务全球顶级汽车OEM客户数从2016年0家增至2024年18家。
**国防领域:AI赋能未来战场**
+ Anduril Industries:专注于将AI技术应用于国防和国家安全,开发部署AI赋能自主防御系统(如自主侦察、监视、目标识别、拦截的无人机群和反入侵系统)。认为AI和自主系统能使军事行动更精准、具比例性,减少附带损伤。年收入过去两年均翻倍,2024财年估计超8亿美元。
采矿勘探领域:AI提升资源发现效率
+ **KoBold Metals**:将AI应用于矿产勘探,整合分析海量地质、地球物理、地球化学数据,利用复杂统计建模和机器学习预测识别潜在矿床。较传统方法更高效筛选广阔区域、精准定位,显著提高成功率。每投入10亿美元勘探支出所发现经济价值矿床数远高于行业平均,扭转近年全球矿产勘探效率下降趋势。
农业现代化领域:AI助力精准农业
+ **Carbon Robotics**:开发基于AI和计算机视觉的激光除草机器人,实时识别杂草并用高精度激光根除而不伤作物。截至2025年5月,机器人机队累计为超23万英亩土地除草,估算助农减少超10万加仑化学除草剂(如草甘膦)使用。
+ **Halter**:为畜牧业提供AI驱动智能放牧解决方案。通过牲畜佩戴内置GPS和传感器的智能项圈,结合AI算法实现虚拟围栏管理、健康监测、行为分析、优化放牧路径等。新增牲畜项圈合同数量在2025年(Q1年化值)同比增长150%。
**第六章的深层启示**
1. 物理世界AI应用中强大的“数据飞轮”效应正在形成并加速技术迭代:AI在物理世界(自动驾驶汽车、工业机器人等)运行过程本身持续产生海量、高质量、与真实物理环境紧密相关的结构化/非结构化数据(如特斯拉FSD行驶数据,Waymo运营积累的罕见路况数据),对训练优化AI在物理世界感知、决策、控制能力至关重要,形成数据越多模型越智能的正反馈。
1. AI技术正在驱动物理世界资产向“软件化”和“智能化即服务”转型:传统物理资产(汽车、农机等)价值主要在硬件。AI融入使其转变为可由软件定义、可持续升级、并能提供智能化服务的智能终端。Applied Intuition将自动驾驶能力从硬件抽象,特斯拉通过OTA升级FSD功能均是体现。未来物理资产价值将更多体现在AI软件、数据智能及衍生服务,硬件或面临商品化,催生从销售硬件到基于使用效果或服务收费的新商业模式。
1. **AI在农业、矿业等传统行业的应用,不仅带来了显著**的“降本增效”,更有可能“重塑行业模式”:AI为传统行业注入活力,解决痛点。Carbon Robotics激光除草降成本、提环保。KoBold Metals AI勘探提高效率、降风险。Halter智能放牧提升生产力和可持续性。AI应用或从根本上改变这些行业生产方式、决策逻辑和商业模式,从依赖经验转向数据驱动决策。
# 第七章:AI从一开始就驱动全球互联网用户增长 = 前所未见的增长
本章节将探讨人工智能(AI)在全球互联网用户增长中所扮演的日益重要的角色,特别是对于那些即将首次接入互联网的新用户而言,AI可能从一开始就成为他们体验数字世界的主要方式。
**全球互联网用户增长与渗透现状**
过去三十余年(1990-2022年),全球互联网用户数量史诗级增长。国际电信联盟(ITU)数据显示,到2024年,全球互联网用户总数达55亿,年增长率(约6%)呈加速态势。全球互联网渗透率从2005年16%大幅提升至2024年68%。但普及不均衡:北美、欧洲中亚、东亚太平洋、拉美加勒比、中东北非渗透率多超70%;南亚和撒哈拉以南非洲相对较低。城乡差异大:2024年全球城市居民渗透率83%,农村仅48%。全球仍有约26亿人(占总人口32%)未接入互联网,构成未来用户增长巨大潜力。
**新互联网用户的“AI原生”体验**
对于即将首次接触互联网的26亿“新网民”,他们体验的数字世界或与“老网民”迥异,可能直接跨入“AI原生”互联网时代:
+ **低成本卫星互联网普及是重要前提**:以SpaceX的Starlink项目为代表的低成本、广覆盖卫星互联网技术,为传统地面网络难触及地区提供接入可能,极大降低新用户上网物理门槛。
+ 交互方式根本变革:从搜索框到对话式AI:新用户上网初体验或不再是浏览器输关键词,而是直接通过自然语言(可能是母语)与AI助手对话交互。AI成他们探索信息、获取服务、连接数字世界主要界面。
+ **AI代理驱动的统一入口**:未来互联网体验或由AI代理(AI Agent)主导。AI代理能理解用户个性化需求、本地化语境和真实意图,主动智能整合调用后台各种应用服务,提供统一无缝数字服务入口。用户或不再需学习操作众多不同App。
+ **“界面”成为新的竞争焦点**:在“AI优先”体验模式下,传统应用平台重要性或下降,控制用户与数字世界交互的“智能界面”(AI代理本身)将成新战略制高点。
**AI应用在全球的快速渗透**
+ ChatGPT移动应用的现象级增长:截至2025年4月,OpenAI ChatGPT移动应用推出后23个月,全球MAU达5.3亿。用户遍布全球各大区。国家层面(截至2025.4),印度用户最多(占全球13.5%),其次美国(8.9%)、印尼(5.7%)、巴西(5.4%)等。全球下载量和MAU持续强劲增长。
+ DeepSeek移动应用的快速崛起(尤其在中国市场):中国AI公司DeepSeek移动应用2025年1月上线后4个月,全球MAU迅速增至5400万(截至2025.4)。用户主要集中在中国大陆(占33.9%)和俄罗斯(9.2%),并向印度、美国等渗透。
+ **LLM用户份额动态变化**:OpenAI ChatGPT在桌面和移动端用户份额目前领先。但以DeepSeek为代表的新兴AI应用,尤其在特定市场(如中国),正极快崛起构成挑战。
+ **中国AI用户的独特偏好**:更倾向本土企业开发的AI平台和服务。Roland Berger数据显示,中国市场MAU排名前列AI应用(DeepSeek、Kimi、豆包、文心一言等)均为本土开发,均积累数千万用户。
**卫星互联网的赋能作用**
低成本、广覆盖的卫星互联网技术,特别是以SpaceX的Starlink项目为代表的近地轨道(LEO)卫星星座,为全球互联网普及,尤其为传统网络难覆盖地区提供接入,扮演关键赋能角色。
+ SpaceX在卫星发射市场的主导地位:凭借可回收火箭技术成本优势和高频发射能力,SpaceX在全球轨道/卫星发射市场占绝对主导,年度发射次数远超他国和商业实体。
+ Starlink用户数量的指数级增长:Starlink卫星互联网服务全球用户数3.2年内(2021年初-2024年底)增至超500万,年均复合增长率202%。
+ **全球服务覆盖范围持续扩展**:Starlink服务持续向全球扩展,目标为地球任何地点提供高速低延迟连接。
+ 解锁偏远地区互联网接入,迎接AI时代:Starlink已为墨西哥农村社区、智利偏远学区、美国Brightline高速列车、全球Seaspan航运船队等提供高质量互联网接入。这些用户将直接进入AI深度赋能数字时代。
**第七章的深层启示**
1. **AI技术有望成为弥合现有数字鸿沟**的新桥梁,但同时也可能催生新的不平等形式:低成本卫星互联网和AI驱动自然语言交互为全球26亿未联网人口(主要在发展中地区)接入互联网创造机遇。但若AI核心技术、训练数据及应用服务由少数发达国家或大公司主导,可能在文化适应性、价值观取向、知识传播平衡性等方面出现新问题,导致文化单向输出或AI服务适应性不足,制造新数字或认知鸿沟。
1. “界面之争”将成为下一代互联网竞争的核心战场:AI智能代理日益成为用户与数字世界交互主要(甚至唯一)入口,控制该“智能界面”的公司将掌握巨大用户流量、数据及引导能力。AI代理智能整合调用后台应用服务,用户对特定应用直接依赖或降低,对AI界面依赖显著增强。未来互联网竞争焦点或从争夺单个应用领先转向争夺AI界面主导权。
1. AI驱动的个性化和自动化服务将重塑用户期望和数字体验范式:对传统应用和服务模式构成挑战,推动更智能、主动、无缝的数字体验。用户可能不再需要学习和操作众多独立应用程序,而是通过与一个统一的AI代理交互来满足多样化需求,这将深刻改变软件分发、用户获取和商业变现的逻辑。
# 第八章:AI与工作演变 = 真实 + 迅速
本章节深入探讨了人工智能(AI)对工作方式、岗位需求、生产力以及企业采纳AI策略的深远且迅速的影响。AI不仅仅是技术的革新,更在重新定义劳动力的构成和价值创造的模式。
**AI对工作模式的根本性变革**
AI正从根本上改变我们的工作方式。除了物理自动化(机器人、无人机)持续增长,我们正目睹认知自动化兴起,即AI系统能推理、创造和解决问题。AI认知能力提升惊人,自2022年11月ChatGPT发布以来短短三年内,AI推理能力据称已从相当于高中生水平跃升至接近博士候选人水平。以处理大量结构化历史数据并据此进行规则化决策和判断为核心的职业,正直接面临生成式AI核心能力的挑战。劳动力的基本单位可能会从“人类工时”转变为“计算能力”,数据中心和基础模型或决定特定类型劳动力的可用性和质量。一些人预言“代理人未来”(agentic future),即AI代理在许多白领工作中取代人类。尽管如此,历史和模式识别表明人类角色持久重要,技术飞跃通常带来生产力提升和新就业。但这次变化更快。在极端代理人驱动未来,人类角色或转向监督、指导和培训(如员工教机器人复杂动作,或办公室人员为算法提供RLHF),Physical Intelligence和Scale AI等公司已基于此构建业务。
**企业对AI的采纳与战略调整**
+ **广泛的行业影响**:NVIDIA图表显示AI可能影响医疗、金融到制造、零售等几乎所有领域。
+ **AI成为企业基本要求**:
+ Shopify CEO Tobias Lütke内部备忘录强调“反思性使用AI现在是Shopify的基本期望”,认为AI是思考伙伴、研究员、批评家、导师或结对程序员,有效使用AI已成每个人基本要求。
+ Duolingo CEO Luis von Ahn宣布“Duolingo将成为AI优先的公司”,AI不仅提高生产力,还能助公司更接近使命(如AI大规模创建教学内容),AI使用将成招聘和绩效评估一部分,只有在团队无法通过自动化完成更多工作时才增人手。
+ **美国企业的AI采纳率上升**:美国人口普查局BTOS数据显示,截至2025年Q1,约6.9%美国公司在生产商品或服务中使用AI,较2024年Q4的5.7%季度环比增21%。
+ **企业采纳AI的主要目标**(Morgan Stanley & AlphaWise调查,截至2024Q3):提升整体内部员工生产力(如Copilot类工具);节省专业工种劳动力成本/提高生产力(如联络中心、简化财务流程);通过面向客户应用驱动额外收入;通过面向客户应用提升客户满意度;降低组织内部风险;加速产品开发(如药物发现、模型开发、软件开发)。
**AI对生产力的显著提升**
+ **客户支持领域**:斯坦福大学人工智能研究所(HAI)研究(数据截至2023.4)显示,使用AI辅助的客户支持代理,其每小时处理的聊天数量增加了14%(从未使用AI的2.6次增至使用AI的2.97次)。
+ **科学研究领域**:报告提及AI在科学家群体中也带来了生产力提升,但未给出具体百分比。
AI对就业市场和岗位需求的深刻重塑
+ AI相关IT职位激增,非AI职位下降:根据马里兰大学和LinkUp数据,从2018年1月到2025年4月七年间,美国与AI相关的IT职位发布数量激增448%,同期非AI相关IT职位发布数降9%。
+ **AI相关职位名称数量大幅增加**:ZoomInfo数据显示,从2022年Q2到2024年Q2两年间,全球新增含AI术语的职位名称累计数量增200%(从约4万个增至约12万个)。
+ **科技巨头对AI人才的需求旺盛**:苹果公司截至2025年5月有超600个生成式AI相关职位空缺,涉及将创新理念和现代机器学习方法应用于解决实际问题。
**历史视角下的劳动生产力与就业**
美国联邦储备银行圣路易斯分行数据显示,1947-2024年间,美国非农就业人数和劳动生产率均持续增长,经历多次重大技术变革浪潮后整体同步提升。自2000年以来,美国非农劳动生产率增89%,非农就业人数增31%。
**专家视角:适应AI是关键**
NVIDIA联合创始人兼CEO黄仁勋认为:AI将影响每岗位,一些工作会消失,一些新工作被创造。人们“不会因AI而失业,但会因那些使用AI的人而失业”。AI为弥合技术鸿沟提供巨大机遇,因其能以用户希望的任何语言交流。AI也有助解决劳动力短缺,并可能显著提升全球GDP。他强烈建议每个人积极利用AI。
# **第九章的深层启示**
1. **AI对劳动力的影响呈现出“技能偏向型技术变革”的典型**特征,加速了对高认知技能和AI素养的需求:AI相关IT职位数量爆炸性增长与非AI IT职位萎缩形成对比,表明市场对掌握AI技术和能与AI协同工作人才需求激增。企业高管(如Shopify、Duolingo CEO)强调将AI融入日常工作流程正迅速从加分项转为基本要求。未来劳动力市场竞争将是人加AI与人之间的竞争。
1. **AI在提升生产力方面的潜力巨大,但其效**益的实现和分配将取决于多种因素的协同作用:AI在客户支持等领域已展现显著生产力提升效果。企业采纳AI主要动机也集中在提升员工生产力和优化专业工作流程。但要将潜力大规模转化为真实经济增长和社会福祉,需克服AI技术持续优化普及、企业组织业务流程调整、员工技能再培训提升、以及确保AI技术公平可及和收益合理分配的政策框架等挑战。
1. **“人机协作”而非“机器替代”可能是未来工作**场景的主流模式,人类的独特价值将更加凸显:尽管AI认知能力强大,但报告暗示人类在监督、指导、培训AI(如RLHF)及处理复杂、非结构化、需创造力、同理心和伦理判断任务方面仍具不可替代价值。黄仁勋观点也强调是“使用AI的人”而非AI本身构成竞争优势。未来工作场景更有可能是人与AI深度协作、各展所长的新模式,人类更专注于发挥独特认知优势和情感智能。
总结与展望:驾驭AI浪潮,迎接加速变革的未来
BOND Capital 发布的这份《趋势 – 人工智能 (AI)》报告,以其详实的数据、深刻的洞察和广阔的视角,为我们全面描绘了当前AI技术发展的澎湃浪潮及其对全球经济、社会、科技乃至地缘政治格局的颠覆性影响。报告的核心结论——“变革比以往任何时候都快,是的,确实如此”——不仅是一个判断,更是一种警示和号召。
从AI用户和使用量的爆炸性增长、远超互联网早期的资本支出狂潮,到模型训练成本的持续攀升与推理成本的急剧下降所引发的性能趋同和开发者生态繁荣;从AI在物理世界(自动驾驶、国防、农业、矿业)的加速渗透和数据驱动创新,到其从一开始就驱动全球新互联网用户增长的独特模式;再到AI对工作模式、岗位需求和生产力的深刻重塑——报告的每一个章节都揭示了AI技术发展的“加速度”特征及其带来的多维度、深层次变革。
然而,机遇与挑战并存。AI商业化面临着日益激烈的市场竞争、开源模式的冲击以及中国等新兴力量崛起的“三重挤压”,其盈利前景充满不确定性。高昂的研发投入和运营成本,特别是与AI模型训练和推理相关的巨大计算支出和能源消耗,对AI公司的可持续发展构成了严峻考验。同时,AI技术的快速发展也带来了关于数据隐私、算法偏见、就业结构调整、知识产权以及潜在伦理风险等一系列复杂问题,需要社会各界共同应对。
更深层次来看,AI的发展已经超越了单纯的技术和商业范畴,日益与国家战略和地缘政治紧密相连。中美两国在AI领域的激烈竞争,被形象地比作新的“太空竞赛”,AI技术的领先与否,正直接关系到未来的全球影响力和话语权。这使得AI的发展路径、标准制定和应用推广,都可能受到越来越多非市场因素的深刻影响。
面对这场由AI驱动的、速度和广度均前所未有的变革,无论是个人、企业还是国家,都需要保持高度的敏锐性和适应性。积极拥抱AI技术,提升AI素养,探索人机协作的新模式,将是从业者在未来劳动力市场中保持竞争力的关键。企业需要重新审视其战略、组织架构和业务流程,将AI深度融入价值创造的各个环节,并积极应对由此带来的商业模式和竞争格局的重塑。而对于政策制定者而言,如何在鼓励创新的同时,有效规避潜在风险,建立健全的治理框架,确保AI技术发展的普惠性和可持续性,将是未来面临的核心挑战。
正如报告所指出的,“游戏已经开始”。在这场关乎未来的AI竞赛中,没有旁观者。唯有深刻理解趋势,积极拥抱变革,审慎应对挑战,才能在AI时代浪潮中把握先机,共同塑造一个更加智能、高效和包容的未来。BOND的这份报告,无疑为我们提供了导航这一未知水域的宝贵海图。
# 知识库动态
# 2025《TIME》时代杂志评选300+最佳发明
> 来源:[https://aigcreative.feishu.cn/docx/OmvJdNZ3SojUU7xv99DcZ5rtnze](https://aigcreative.feishu.cn/docx/OmvJdNZ3SojUU7xv99DcZ5rtnze)
# **Robotics 机器人技术**
## **Figure 03** - 家用机器人
> The Figure 03 is a humanoid robot with a lofty goal. The company that makes it, Figure AI, wants to build a machine in the form of a human being, and put the bots to work across the global economy—including in homes. Upon its launch this October, the Figure 03 was capable of doing some domestic tasks like folding clothes and loading a dishwasher, but not without help (it can load the machine, but a human needs to start the wash and help if it drops something). Still, the company has embarked on a mass data collection drive to train the robots’ Helix neural network to better complete more types of tasks. CEO Brett Adcock says robotics is on a similar curve to digital AI—suggesting that big capability jumps are coming. He aims to have the Figure 03 in select homes next year.
> Figure 03 是一款有着远大目标的人形机器人。制造它的公司 Figure AI 希望制造出一款与人类相似的机器,并让这些机器人在全球经济中发挥作用,包括家庭。自今年 10 月推出以来,Figure 03 能够完成一些家务,比如折叠衣服和将餐具放入洗碗机,但这需要人工帮助(它可以将餐具放入洗碗机,但需要人工启动洗衣机并在它掉落物品时帮忙)。尽管如此,该公司已开始大规模数据收集,以训练机器人的 Helix 神经网络,使其更好地完成更多类型的任务。首席执行官 Brett Adcock 表示,机器人技术的发展轨迹与数字人工智能相似,这表明它们即将实现巨大的能力飞跃。他的目标是明年让 Figure 03 走进部分家庭。
## EufyMake E1 UV 打印机 - 在家打印纹理
> UV pr[inting ](https://updates.kickstarter.com/eufymakes-breaks-the-all-time-funding-record/)uses ultraviolet lig[ht to](https://updates.kickstarter.com/eufymakes-breaks-the-all-time-funding-record/) [quickly dr](https://www.eufymake.com/eufymake-uv-printer-e1)y special ink on materials like metal, wood, and acrylic. This once complicated process is no longer exclusive to industrial settings, thanks to the largest online crowdfunding campaign in history. EufyMake raised nearly $47 million to develop the world’s first at-home UV printer, which is 90% smaller than traditional UV printers and can print 3D textures on over 300 materials. The product offers users millions of design templates to customize. “The E1 enables hobbyists, small business owners, and entrepreneurs to personalize everyday items or even launch side ventures,” says Frank Zhu of Anker Innovations, which owns eufy.
> UV 打印利用紫外线快速干燥金属、木材和亚克力等材料上的特殊油墨。得益于史上最大规模的在线众筹活动,这一曾经复杂的工艺如今已不再局限于工业领域。EufyMake 筹集了近 4700 万美元,用于开发全球首台家用 UV 打印机 。这款打印机比传统 UV 打印机小 90%,可在 300 多种材料上打印 3D 纹理。该产品为用户提供数百万个可定制的设计模板。eufy 母公司 Anker Innovations 的 Frank Zhu 表示:“E1 让业余爱好者、小企业主和创业者能够个性化定制日常用品,甚至可以开展副业。”
## HoverAir X1 ProMax - 您的个人摄像师
> The catch-22 of documenting life’s moments is that you have to step out of those moments to capture them. Not with the HOVERAir X1 PROMAX, an action camera that’s small enough to slip in a pocket. The device flies alongside users as they carve down a ski slope or run across a ridgeline, shooting 8k video and tracking them using AI. Built-in sensors help avoid collisions, but it’s also made from an aerospace-grade material that’s flexible and tough enough to survive an inevitable crash.
> 记录生活中的精彩瞬间,难就难在你必须跳出框框才能捕捉到它们。有了 HOVERAir X1 PROMAX,这台小巧便携的运动相机就能帮你轻松捕捉。无论用户在滑雪坡上滑行还是在山脊上奔跑,它都能与用户并肩飞行,拍摄 8K 视频并使用 AI 追踪。内置传感器有助于避免碰撞,同时它还采用了航空级材料制成,兼具柔韧性和韧性,足以抵御不可避免的碰撞。
## **Unitree R1** - 超灵活的人形机器人
> From drones to self-driving cars, most robots today aren’t the humanoid versions imagined in science fiction. One exception is the R1 from China-based Unitree Robotics. Introduced in July with a shockingly low starting price of just $5,900, this bipedal programmable robot caters to researchers, educators, and software developers testing AI and robotics projects. It weighs just 55 pounds, features built-in AI that supports voice recognition and image processing, and has 26 joints (humans have some 300) that have allowed it to wow audiences with complex movements like boxing, running, and even cartwheeling.
> 从无人机到自动驾驶汽车,如今的大多数机器人并非科幻小说中想象的类人机器人。但中国宇树机器人公司(Unitree Robotics)的 R1 机器人却是个例外。这款双足可编程机器人于今年 7 月上市,起售价仅为 5900 美元,令人咋舌。它主要面向测试人工智能和机器人项目的研究人员、教育工作者和软件开发者。它重量仅为 55 磅(约 23 公斤),内置人工智能,支持语音识别和图像处理,并拥有 26 个关节(人类大约有 300 个关节),能够以拳击、跑步甚至侧手翻等复杂动作惊艳观众。
# Accessibility 无障碍
## American Printing House Monarch - 在平板电脑上提供盲文和图形
> Blin[d stude](https://www.aph.org/product/monarch/)nts often have to use old textbooks because it takes so long for new ones—not to mention all the other texts students use—to be translated into Braille. Monarch replaces them with a letter-size slate whose 3,840 electromagnetic pins rise to display multiline Braille or tactile graphics, on each of which a touch sensor lets users swipe and tap like on a regular tablet. “Our vision was to build an iPad for blind people,” says Greg Stilson, who leads product innovation at the American Printing House for the Blind. A stacked “Lego-style” cell array is the breakthrough that made it possible. Nearly 1,100 units are now in classrooms—assisting about 20% of the U.S. students who need one.
> [盲](https://www.aph.org/product/monarch/)人学生经常不得不使用旧教科书,因为新教科书(更不用说学生使用的所有其他教材)需要很长时间才能翻译成盲文。Monarch 用一块信纸大小的平板取代了旧教科书,其 3,840 个电磁针可以升起显示多行盲文或触觉图形,每个针上都有一个触摸传感器,用户可以像在普通平板电脑上一样滑动和点击。“我们的愿景是为盲人打造一款 iPad,”美国盲人印刷厂产品创新主管 Greg Stilson 说道。堆叠式“乐高式”单元阵列是实现这一目标的突破。目前,近 1,100 台设备已部署在各教室中,为约 20% 的美国学生提供帮助。
## **Lotus Ring** - 点击式智能家居戒指
> Dhava[l Pat](https://getlotus.com/)el has spent his life relying on crutches to walk, and would often leave lights on rather than struggle to get up to adjust them. Eventually, the former Apple engineer quit his job to build Lotus, an accessibility device that lets you turn on or off a lightswitch or TV simply by pointing at it. Press a button on the rechargeable ring—the battery lasts four to six months—and an infrared signal triggers specialized covers that flip switches without any rewiring, apps, or the need to get up. It’s like a universal remote you can wear.
> 达瓦尔·帕特尔(Dhaval Patel)一生都拄着拐杖行走,他[经常开着灯](https://getlotus.com/),而不是费力地站起来调整。最终,这位前苹果工程师辞去了工作,转而开发 Lotus ,这是一款辅助设备,只需指向灯开关或电视,即可打开或关闭。按下可充电环上的按钮(电池续航时间为四到六个月),红外信号就会触发特制的盖子,无需重新布线、安装应用程序或起身即可切换开关。它就像一个可以佩戴的万能遥控器。
## **Tilt Grip Stick** - 适应性润唇膏
> One in four U.S. adults lives with a disability, yet only 4% of beauty brands cater to them. Tilt Beauty founder Aerin Glazer grew up with psoriatic arthritis, and created the Grip Stick lip balm for people with limited dexterity, chronic pain, and other accessibility needs. "Makeup should be easy to open, hold, and apply—for everyone," she says. The first lip product to earn the Arthritis Foundation's Ease of Use Certification, the Grip Stick features an oversized elastomer grip, a magnetic closure, and a patented easy-open tear strip, making it usable one-handed or with limited grip strength.
> 四分之一的美国成年人身患残疾,但只有 4%的美妆品牌为他们提供产品。Tilt Beauty 创始人 Aerin Glazer 从小就患有银屑病关节炎,她为行动不便、患有慢性疼痛和其他无障碍需求的人士设计了 Grip Stick 润唇膏。“化妆品应该易于打开、握持和涂抹——对每个人都适用,”她说。Grip Stick 是首款获得关节炎基金会易用性认证的唇部产品,采用超大弹性体握柄、磁力扣和获得专利的易开式撕条,即使单手或握力有限也能轻松使用。
# **Aerospace 航空航天**
## AST SpaceMobile BlueBird - 从太空传输的超高速互联网
> While other space-internet empires are being built with thousands of small satellites, Abel Avellan is taking a different approach. "For a true broadband experience, you can only solve that with size," says Avellan, founder and CEO of AST SpaceMobile, which produces satellites with the largest commercial antennas ever deployed in low-Earth orbit. Five of its BlueBirds are already circling, and even larger satellites planned for launch in the coming months would enable peak transmission speeds of 120 Mbps, new benchmarks for space-beamed internet. Partnerships mean AT&T and Verizon customers will have satellite capabilities built in, while others can purchase variable-rate plans. AST plans to have intermittent service in the U.S. by the end of this year, with global reach in 2026.
> 当其他太空[互联网帝国正在](https://ast-science.com/spacemobile-network/direct-connection/)利用数千颗小型卫星构建时,阿贝尔·阿维兰却另辟蹊径。“要获得真正的宽带体验,只有尺寸才能解决这个问题,”AST SpaceMobile 的创始人兼首席执行官阿维兰说道。该公司生产的卫星拥有迄今为止在近地轨道部署的最大商用天线。该公司的五颗“蓝鸟”卫星已在轨道上运行,未来几个月计划发射的更大卫星将实现 120 Mbps 的峰值传输速度,这将为太空互联网树立新的标杆。通过合作, AT&T 和 Verizon 的客户将拥有内置的卫星功能,而其他客户则可以购买可变费率套餐 。AST 计划在今年年底前在美国推出间歇性服务,并于 2026 年实现全球覆盖。
## Firefly Blue Ghost - 月球探索的新进展
> In March, Firefly Aerospace’s Blue Ghost lander became the fi[rst private](https://www.nasa.gov/commercial-lunar-payload-services/) spacecraft to land successfully on the moon. In cooperation with NASA, Blu[e Gho](https://fireflyspace.com/missions/blue-ghost-mission-2/)st carried 10 scientific instruments, including a laser reflector to measure the moon’s shape and precise distance from Earth. Firefly plans to launch another lander next year to the moon’s far side, followed by launches in 2028 and 2029, with the goal of creating a path for humans to return to the lunar surface. “As more humans return to the moon,” says Firefly CEO Jason Kim, “we want them to have the supplies they need to sustain life.”
> 今[年 3 ](https://www.nasa.gov/commercial-lunar-payload-services/)月,萤火虫航天公司的“蓝色幽灵”着陆器成为首个成功登[陆月](https://fireflyspace.com/missions/blue-ghost-mission-2/)球的私人航天器。“蓝色幽灵”与美国国家航空航天局(NASA) 合作 ,搭载了 10 台科学仪器,其中包括一台用于测量月球形状和与地球精确距离的激光反射器。萤火虫计划明年向月球背面发射另一台着陆器,随后在 2028 年和 2029 年发射,目标是为人类重返月球表面开辟一条道路。“随着越来越多的人类重返月球,”萤火虫首席执行官杰森·金表示,“我们希望他们能够获得维持生命所需的物资。”
## **FireSat** - 早期火灾探测
> E[arlier t](https://www.earthfirealliance.org/press-release/firesat-first-wildfire-images)his year, a small roadside fire in Oregon was detected by a newly launched satellite. It was proof of concept for FireSat, a next-level wildfire detection system that can identify “fires as small as 5-by-5 meters—about the size of a one-car garage—long before they grow into disaster fires,” says Brian Collins, executive director of Earth Fire Alliance (EFA). In collaboration with Muon Space and Google Research, the nonprofit plans to build by 2030 a constellation of 50 satellites outfitted with advanced infrared sensors that scan the planet’s most fire-prone regions every 20 minutes. Nine fire agencies on three continents are now using the system.
> 今年早些时候,一颗新发射的卫星[探测到了](https://www.earthfirealliance.org/press-release/firesat-first-wildfire-images)俄勒冈州的一场小型路边火灾。这验证了 FireSat 的概念。FireSat 是一种新一代的野火探测系统,能够“在火灾发展成灾难性火灾之前,就识别出小至 5 米乘 5 米(大约相当于一个车库的大小)的火灾”,地球火灾联盟(EFA)执行董事布莱恩·柯林斯(Brian Collins)说道。该非营利组织与 Muon Space 和谷歌研究院合作,计划到 2030 年建成一个由 50 颗配备先进红外传感器的卫星组成的卫星群,每 20 分钟扫描一次地球上最易发生火灾的地区。目前,三大洲的九个消防机构正在使用该系统。
## Vera C. Rubin 天文台 - 天空之眼
> Astronomy’s newest telescope is a cosmic paparazzi, taking about 1,000 pictures of the southern sky every night from a mountaintop in Chile. With giant mirrors concentrating starlight into a 3,200-megapixel camer[a, the Ve](https://rubinobservatory.org/news/rubin-first-look/swarm-asteroids)ra C. Rubin Observatory is expected to reveal billions of cosmic objects in the next decade, and could solve some tantalizing mysteries—including whether another planet exists beyond Pluto. Sandrine Thomas, the deputy director of Rubin's construction, calls it a "discovery machine;" in a preview this summer, Rubin snapped more than 2,000 never-before-seen asteroids. The observatory is expected to begin full operations by the end of the year.
> 天文学界最新的望远镜堪称宇宙狗仔队,每晚从智利的一座山顶拍摄约 1000 张南半球天空的[照片 。维拉·C·](https://www.nationalgeographic.com/science/article/vera-rubin-observatory-new-telescope-science-mysteries)鲁[宾天文台](https://rubinobservatory.org/news/rubin-first-look/swarm-asteroids)拥有巨大的镜面,将星光汇聚到一台 3200 万像素的相机中,预计在未来十年内将发现数十亿颗宇宙天体,并可能解开一些令人着迷的谜团——包括冥王星之外是否存在其他行星 。鲁宾天文台的建造副主任桑德琳·托马斯称其为“发现机器”;在今年夏天的一次预览中,鲁宾天文台拍摄到了 2000 多颗前所未见的小行星 。该天文台预计将于今年年底全面投入运营。
# **Agriculture 农业**
## FutureFeed Asparagopsis 补充剂 - 清理牛打嗝和甲烷排放
> Livestock burps and manure are a major source of methane, a potent greenhouse gas with nearly 80 times the global warming power of carbon dioxide over a two-decade period. To reduce those emissions, scientists fro[m CSIRO—th](https://agfundernews.com/symbrosia-submits-key-data-to-fda-for-seaweed-based-feed-supplements-for-livestock-methane-reduction-plans-new-15-acre-site)e Au[stralian g](https://agfundernews.com/symbrosia-submits-key-data-to-fda-for-seaweed-based-feed-supplements-for-livestock-methane-reduction-plans-new-15-acre-site)overnment’s research agency—developed a seaweed-based feed supplement for cattle called Asparagopsis that recent studies have shown can reduce emissions by up to 80 percent. FutureFeed, the company CSIRO created to commercialize Asparagopsis, is licensing the technology to seaweed growers in Hawaii, Australia, New Zealand, and Europe. It could be some time before Asparagopsis is commercially approved in the U.S.: A proposal to sell the supplement is undergoing FDA review.
> 牲畜的打嗝声和粪便是[甲烷的主要来源 ](https://openknowledge.fao.org/server/api/core/bitstreams/35d93105-3c0b-4cc8-8a99-7c7b504e233b/content),甲[烷是一种强](https://www.future-feed.com/science)效[温室气体](https://agfundernews.com/symbrosia-submits-key-data-to-fda-for-seaweed-based-feed-supplements-for-livestock-methane-reduction-plans-new-15-acre-site)[,其全球变暖能力在](https://agfundernews.com/red-seaweed-was-billed-as-a-gamechanger-for-livestock-methane-reduction-so-when-will-it-deliver?utm_source=chatgpt.com)二[十年内几乎是二氧](https://agfundernews.com/symbrosia-submits-key-data-to-fda-for-seaweed-based-feed-supplements-for-livestock-methane-reduction-plans-new-15-acre-site)化碳的 80 倍。为了减少这些排放,澳大利亚政府研究机构 CSIRO 的科学家开发了一种名为 Asparagopsis 的海藻基牛饲料补充剂,最近的研究表明, 这种补充剂可以减少高达 80% 的排放。CSIRO 为商业化 Asparagopsis 而创建的 FutureFeed 公司正在向夏威夷、 澳大利亚、新西兰和欧洲的海藻种植者授权这项技术。Asparagopsis 在美国获得商业批准可能还需要一段时间:销售这种补充剂的提案正在接受 FDA 的审查 。
## Innovea 全球咖啡育种网络 - 保障咖啡的未来
> The coffee varieties grown today were developed before climate change and diseases like leaf rust threat[ened crops. To ens](https://worldcoffeeresearch.org/programs/global-breeding-network)ure cups of joe for generations to come, the nonprofit World Coffee Research (WCR) in 2022 formed the Innovea Global Coffee Breeding Network, bringing together companies and government-affiliated research institutions to develop new varieties. This year, researchers in nine countries including Costa Rica and Rwanda have begun breeding trials. Farmers will likely have to wait until 2037 for the new, more resilient varieties, says Vern Long, CEO of WCR, but that’s still sooner than ever before. “We’re creating the best genetics by working together at scale,” Long says.
> 如今种植的咖啡品种是在气候变化和叶锈病等疾病威胁作物之前培育出来的。为了确保子孙后代都能享用咖啡,非营利组织世界咖啡研究组织 (WCR) 于 2022 年成立了 Innovea 全球咖啡育种网络 ,将企业和政府附属研究机构联合起来,共同开发新品种。今年,包括哥斯达黎加和卢旺达在内的九个国家的研究人员已经开始了育种试验。WCR 首席执行官 Vern Long 表示,农民可能要等到 2037 年才能获得新的、更具抗逆性的品种,但这仍然比以往任何时候都要早。“我们正在通过大规模合作创造最佳基因,”Long 说。
## RootWave eWeeder - 减少农用化学品
> Herbicides can have dangerous drawbacks, so U.K.-based RootWave developed a new nontoxic approach to weeds: The company’s tractor-mounted eWeeder zaps them with electricity. Designed for use in vineyards, orchards, and bush-fruit farms, the machine uses high-frequency, low-energy AC waveforms to fry weeds to their roots, killing up to 99% in row crops on a single pass, but leaving the soil and surrounding plants unharmed. The company says it’s cheaper on a per-hectare basis than herbicides, which are becoming less effective as plants adapt. And “there's no health or environmental consequences to it,” CEO Andrew Diprose says.
## **Scout Gen 5** - 葡萄园经理
> In 2017, a wildfire nearly claimed the home of Scout CEO Kia Behnia. “Our vineyard saved our house,” he says, by acting as a natural firebreak. Now his company’s flagship platform, Scout Gen 5, returns the favor by helping farmers keep an eye on every vine. Launched in April, the software analyzes vintners’ photos and geolocations—from smartphones to those mounted on the back of ATVs—then uses AI to create an interactive vineyard map, plus a vine-level inventory with insights into each plant’s health, maturity, and productivity. “Farmers have this natural intuition,” Behnia says. “Scout doesn't take the artistry away—it scales it.”
> 2017 年,一场野火几乎烧毁了 Scout 首席执行官 Kia Behnia 的家。“我们的葡萄园拯救了我们的房子,”他说,因为它充当了天然的防火带。现在,他公司的旗舰平台 Scout Gen 5 回报了人们的帮助,帮助农民密切关注每一棵葡萄树。该软件于 4 月推出,可以分析酿酒师的照片和地理位置——从智能手机到安装在 ATV 后面的设备——然后使用人工智能创建交互式葡萄园地图,以及葡萄树级别的清单,深入了解每棵植物的健康状况、成熟度和产量。“农民有这种天生的直觉,”Behnia 说。“Scout 并没有夺走艺术性——而是将其规模化。”
## Thunderstruck Razors Edge Concaves - 更高效的收割
> Large-scale farmers might grow oats, barley, canola, sunflowers, soybeans, and corn. Accommodating this variability can mean expensive delays from changing concaves, the part on a combine that separates grain from chaff. Thunderstruck’s founder Jeremy Matuszewski debuted the Razors Edge Concaves last November to save that time. “The [concaves’] bar spacing…is variable based on crop flow, which balances the combine,” meaning farmers don’t have to change concaves between crops, Matuszewski says. Per field tests, the Razors Edge Concaves increased harvesting speed by 25%, reduced grain loss, and decreased fuel consumption by 40%.
> 大规模种植的农民可能会种植燕麦、大麦、油菜、向日葵、大豆和玉米。适应这种变化可能会因更换收割机上的凹板(联合收割机上用于分离谷物和谷壳的部件)而造成昂贵的延误。Thunderstruck 的创始人 Jeremy Matuszewski 于去年 11 月首次推出了 Razors Edge 凹板,以节省这部分时间。Matuszewski 说:“(凹板的)杆间距……可根据作物流量进行调整,从而平衡联合收割机。” 这意味着农民无需在不同作物之间更换凹板。田间测试显示,Razors Edge 凹板使收割速度提高了 25%,减少了谷物损失,并降低了 40% 的燃料消耗。
## Vanilla Vida 数据驱动的室内固化 - 适应气候的香草种植
> Today, most of the vanilla we consume comes from synthetic sources, not the fruit of the orc[hids that t](https://phys.org/news/2025-03-heart-vanilla-country-farmers-front.html)hrive in the tropical climates [of ](https://phys.org/news/2025-03-heart-vanilla-country-farmers-front.html)a s[mall numbe](https://agfundernews.com/exclusive-vanilla-vida-celebrates-worlds-first-large-scale-indoor-vanilla-harvest)r of countries. As rainfall and droughts, intensified by climate change, imperil vanilla farms, Israel-based Vanilla Vida is seeking to bolster global supply of natural vanilla by growing it indoors, in climate-controlled facilities, using imaging and other precise farming technology to monitor the curing process, shorten growth time, and yield richer flavor. The company harvested its first beans in January, and next year will debut a new growing facility in Uganda.
> 如今,我们消费的大部分香草都来自人工合成,而非少数国家热带地区生长的兰花果实。气候变化加剧了降雨和干旱,香草农场因此面临危机。以色列香草维达公司 (Vanilla Vida) 正致力于提升全球天然香草的供应,其方式包括:在室内恒温恒湿的设施中种植香草,并利用成像和其他精准农业技术来监控香草的成熟过程,缩短生长时间,从而提升香草的风味。该公司于今年 1 月收获了第一批香草豆 ,并将于明年在乌干达启用新的种植设施。
# **Apps** & Software 应用软件
## Adobe Podcast Enhance Speech - 影响者音频工具
> Joe Rogan, Call Her Daddy, Huberman Lab. Podcasts are booming, and Adobe’s latest AI speech enhancement tool is giving them more polish. In November 2024, the company released version two of Enhance Speech within Adobe Podcast, its online suite of podcasting tools. Enhance Speech instantly removes noise, echo, and distortion from audio captured in busy public places or in rooms with poor acoustics. “You can have the most brilliant story to tell, but if it’s muffled by background noise or echo, people tune out,” Adobe Head of AI Audio Jay LeBoeuf says. Enhance Speech has already enhanced more than 100 million files.
> Joe Rogan,Call Her Daddy,Huberman Lab。播客正在蓬勃发展,Adobe 最新的 AI 语音增强工具使其更加完善。2024 年 11 月,该公司在其在线播客工具套件 Adobe Podcast 中发布了增强语音功能的第二版。增强语音功能可立即消除在人流密集的公共场所或音质较差的房间中录制的音频中的噪音、回声和失真。“即使你拥有最精彩的故事,但如果被背景噪音或回声掩盖,人们也会失去兴趣,”Adobe AI 音频主管 Jay LeBoeuf 说道。增强语音功能已增强了超过 1 亿个文件。
## Buzzkill Notification Manager - 安卓用户的专注工具
> News alerts, emails, text messages, updates—notifications can be a lot. BuzzKill is an app that lets Android users build plain-language rules to decide, with greater control, which notifications hit their home screens and when. For example, a user can decide to only receive notifications from a WhatsApp group when it mentions a specific person or term, or only buzz once if you get a bunch of alerts at the same time. The app has 25 plug-in-style actions, and more than 20,000 users. BuzzKill also sits locally and never sends data off-device. “I don’t want any of your data,” says Sam Ruston, the U.K.-based independent developer behind the app.
> 新闻提醒、电子邮件、短信、更新——通知种类繁多。BuzzKill 是一款应用,允许安卓用户构建简明易懂的规则,从而更好地控制哪些通知在何时出现在主屏幕上。例如,用户可以选择仅在 WhatsApp 群组提及特定人物或术语时接收通知,或者仅在同时收到多条通知时发出一次通知。该应用拥有 25 个插件式操作,用户超过 2 万。BuzzKill 也位于本地,绝不会将数据发送到设备外。“我不想要你的任何数据,”这款应用背后的英国独立开发者 Sam Ruston 说道。
## **Exygy CiviForm** - 简化公共服务的使用
> Applying for public services often involves navigating byzantine websites and frustrating phone calls. CiviForm is an open-source software that consolidates public program applications into one streamlined, easy-to-use platform. While the project began during the pandemic as a joint effort between Seattle and Google.org, developers recognized its greater potential; the system moved to civic tech firm Exygy for broader deployment in 2023. “Other governments were all struggling with this exact same problem,” says Isabel Shaw, Exygy’s chief product officer. Now used in U.S. cities including Charlotte, N.C., and Bloomington, Ind., as well as the state of Arkansas, CiviForm serves more than 8 million people.
> 申请公共服务通常需要浏览错综复杂的网站和接听令人抓狂的电话。CiviForm 是一款开源软件,它将公共项目申请整合到一个精简易用的平台中。虽然该项目始于疫情期间,由西雅图和 Google.org 共同发起,但开发人员意识到了它的巨大潜力;该系统于 2023 年转移到市政科技公司 Exygy,以进行更广泛的部署。Exygy 首席产品官伊莎贝尔·肖表示:“其他政府也都在努力应对同样的问题。” CiviForm 目前已在美国北卡罗来纳州夏洛特、印第安纳州布卢明顿等城市以及阿肯色州投入使用,服务人口超过 800 万。
## Pindrop Pulse for Meetings - 企业级深度伪造检测
> Pindrop Pulse takes aim at the growing threat of real-time deepfake fraud. “Identity, consent, and accountability are society’s contracts. Deepfakes erode all three,” says CEO [and c](https://www.pindrop.com/article/why-your-hiring-process-now-cybersecurity-vulnerability/)o-foun[der](https://www.pindrop.com/article/why-your-hiring-process-now-cybersecurity-vulnerability/)[ Vijay Balasub](https://edition.cnn.com/2024/02/04/asia/deepfake-cfo-scam-hong-kong-intl-hnk)ramaniyan. Pulse for Meetings verifies that the right person is on the other end of a call—audio or video—stopping scams within as little as two seconds of speech. The need is urgent: Pindrop found deepfakes were becoming increasingly common in job interviews, and a single deepfake CFO triggered $25 million in scam transfers last year. Pindrop’s product is built on Georgia Tech research and battle-tested across major enterprise deployments.
> Pindrop Pulse 瞄准日益增长的实时深度伪造欺诈威胁。“身份、同意和责任是社会的契约。深度伪造会侵蚀这三者,”首席执行官兼联合创始人 Vijay Balasubramaniyan 表示。Pulse for Meetings 可在短短两秒内验证通话双方(音频或视频)是否为正确人员,从而阻止诈骗。这一需求迫在眉睫:Pindrop 发现深度伪造在求职面试中越来越常见,去年一位深度伪造的首席财务官就引发了 2500 万美元的诈骗转账 。Pindrop 的产品基于佐治亚理工学院的研究成果,并在主要企业部署中经过了实战检验。
## Zown Down Payment Boost Program - 更实惠的购房
> Saving for a down payment is no small feat. Zown, a digital real estate platform, aims to make home buying more affordable and efficient. Buyers are matched with licensed Zown agents, who are paid hourly based on performance, not commission; when buyers find a home, the company receives 2.5% commission from the seller but returns 1.5% to buyers to bolster their down payment. Except for home viewing, Zown handles deals entirely remotely. “Our secret sauce is building customer relationships digitally,” says CEO Rishard Rameez. The Canadian startup expanded to California in May and has completed over $300 million in transactions.
> 攒首付并非易事。数字房地产平台 Zown 旨在让购房更经济、更高效。买家会与 Zown 的持牌经纪人匹配,经纪人按小时支付绩效工资,而非佣金;买家找到合适的房源后,公司会从卖家那里收取 2.5% 的佣金,但会向买家返还 1.5% 以增加首付。除了看房之外,Zown 完全远程处理交易。“我们的秘诀是通过数字化方式建立客户关系,”首席执行官 Rishard Rameez 说道。这家加拿大初创公司于 5 月扩展到加州,目前已完成超过 3 亿美元的交易。
# Artificial Intelligence 人工智能
## **Ambiq SPOT** - 超高能效芯片
> Artificial intelligence is notoriously power-hungry, hoovering energy as it pumps out information. In battery-operated devices, that becomes restrictive: manufacturers must choose between energy-sucking AI features and limited power banks. Ambiq’s proprietary Sub-threshold Power Optimized Technology (SPOT) chip design lets AI inferencing run locally—without connecting to the cloud—reducing energy use while boosting speed and functionality. “We help [device manufacturers] do things they weren't able to do before,” says Charlene Wan, Ambiq’s VP of branding, marketing, and investor relations. Currently, Ambiq’s chips have been installed in 280 million commercial devices, including smart watches from Garmin and Xiaomi; in July 2025, the company went public.
> 众所周知,人工智能耗电严重,在输出信息时会消耗大量能量。对于电池供电的设备来说,这一点尤为重要:制造商必须在高能耗的 AI 功能和有限的移动电源之间做出选择。Ambiq 专有的亚阈值功耗优化技术(SPOT)芯片设计,让 AI 推理可以在本地运行,无需连接云端,从而降低能耗,同时提升速度和功能。“我们帮助[设备制造商]实现他们以前无法做到的事情,”Ambiq 品牌、市场营销和投资者关系副总裁 Charlene Wan 说道。目前,Ambiq 的芯片已安装在 2.8 亿台商用设备中,包括 Garmin 和小米的智能手表;该公司将于 2025 年 7 月上市。
## Anthropic Claude Sonnet 4 - 更快的大众人工智能模型
> When Anthropic launched its Claude Sonnet 4 model in May, users immediately took to the general-use large language model. “I was honestly surprised by the amount of adoption of Sonnet 4,” says Dianne Na Penn, Anthropic’s head of product management, research; she says 75% of [API users swit](https://menlovc.com/perspective/2025-mid-year-llm-market-update/)c[hed to ](https://www.anthropic.com/news/1m-context)Sonnet 4 within a week of its releas[e. The ](https://techcrunch.com/2025/08/12/anthropics-claude-ai-model-can-now-handle-longer-prompts/)model qui[ckly became a ](https://www.anthropic.com/news/claude-sonnet-4-5)favorite with coders, capturing more than double the market share of OpenAI among enterprise developers, according to a survey by Menlo Ventures. Post-release, Anthropic significantly expanded Sonnet’s context window, allowing it to handle much longer prompts—including up to 75,000 lines of code—and more than double the size of competitors' including OpenAI’s GPT-5. The company released Sonnet 4.5 in September, showing even quicker and more accurate calculations.
> 当 Anthropic 在 5 月份推出其 Claude Sonnet 4 模型时,用户立即喜欢上了这个通用的大型语言模型。“说实话,Sonnet 4 的采用率让我很惊讶,”Anthropic 的产品管理和研究主管 Dianne Na Penn 表示;她表示,75% 的 API 用户在 Sonnet 4 发布后一周内就转向了它。Menlo Ventures 的一项调查显示,该模型很快成为程序员的最爱,在企业开发者中占据了 OpenAI 两倍以上的市场份额。发布后,Anthropic 显著扩展了 Sonnet 的上下文窗口,使其能够处理更长的提示(包括多达 75,000 行代码),并且比包括 OpenAI 的 GPT-5 在内的竞争对手的提示大小增加了一倍多 。该公司于 9 月发布了 Sonnet 4.5 ,显示出更快、更准确的计算。
## DataSnipper DocuMine - 人工智能驱动的财务审计
> Auditors are the frontline workers of financial integrity, ensuring that businesses and governments comply with crucial, increasingly complex regulations. But much of their workday is spent reviewing documents manually. DocuMine, from the Dutch company DataSnipper, uses AI to automate this analysis, as well to verify data and link each insight back to its source. In April 2025, DocuMine launched within Microsoft Excel, which 1.3 million auditors and most finance professionals already use, offering them a smarter, scalable solution for a $217 billion industry that needs faster, more accurate audits—all with uncompromised transparency.
> 审计师是维护财务诚信的一线工作人员,确保企业和政府遵守至关重要且日益复杂的法规。但他们的大部分工作时间都花在手动审查文件上。荷兰公司 DataSnipper 的 DocuMine 使用人工智能自动执行此类分析,并验证数据并将每个洞察关联回其来源。2025 年 4 月,DocuMine 在 Microsoft Excel 中正式推出,目前已有 130 万审计师和大多数财务专业人士使用这款软件。DocuMine 为价值 2170 亿美元的行业提供了一个更智能、可扩展的解决方案,该行业需要更快、更准确的审计,并且所有这些都具有不折不扣的透明度。
## **DeepSeek R1** - 低成本的 LLM 挑战者
> The abrupt appearance of DeepSeek’s R1 advanced reasoning model at the start of the year was akin to the “shot heard ‘round the world” in AI circles. Major tech companies had spent recent years pouring billi[ons into](https://archive.is/e8VDc) gen[erative AI p](https://www.reuters.com/technology/chinas-deepseek-claims-theoretical-cost-profit-ratio-545-per-day-2025-03-01/)[roje](https://archive.is/e8VDc)cts, products, and infrastructure. Meanwhile, Chinese startup DeepSeek created in just months a model as good as OpenAI’s then-most advanced product on industry-standard benchmarks—and claimed to have spent just $6 million to train it. DeepSeek’s model also used a fraction of the compute as its U.S. competitors—and it’s still free to use.
> 今年年初,DeepSeek R1 高级推理模型的突然亮相,无异于人工智能圈“轰动全球”的一声枪响。近年来,各大科技公司已投入数十亿美元用于生成式人工智能项目、产品和基础设施建设。与此同时,中国初创公司 DeepSeek 仅用几个月时间就创建了一个在行业标准基准上与 OpenAI 当时最先进的产品不相上下的模型,并声称只花费了 600 万美元来训练它 。DeepSeek 的模型使用的计算量仅为其美国竞争对手的一小部分 ,而且仍然可以免费使用。
## Nvidia DGX Spark - 桌面级人工智能超级计算机
> AI compute power has so far been reserved for those with access to pricey cloud clusters. But Nvidia’s DGX Spark packs 1 petaflop of compute and 128GB of memory into a small-sized desktop, powered by the company’s Grace Blackwell GB10 Superchip. It can fine-tune AI models with up to 200 billion parameters. “Offering petaflops of AI performance on a desktop device is groundbreaking, because we really think it’ll unlock the democratization of AI,” says Dion Harris, senior director of high-performance computing and AI factory solutions at Nvidia. The computer can be linked to another DGX Spark to churn through bigger models and will cost $3,999, with reservations already open through select sellers.
> 迄今为止,AI 计算能力仅限于那些能够使用昂贵云集群的厂商。但英伟达的 DGX Spark 却将每秒 1 千万亿次浮点运算的计算能力和 128GB 内存集成到一台小型台式机中,并搭载该公司的 Grace Blackwell GB10 超级芯片。它可以对多达 2000 亿个参数的 AI 模型进行微调。“在桌面设备上提供每秒千万亿次浮点运算的 AI 性能具有开创性的意义,因为我们坚信这将开启 AI 的民主化进程,”英伟达高性能计算和 AI 工厂解决方案高级总监 Dion Harris 表示。这台计算机可以连接到另一台 DGX Spark,以处理更大规模的模型,售价 3999 美元,目前已通过指定经销商开放预订。
## UiPath Agentic Automation - 连接人工智能代理
> Agen[tic AI ](https://www.uipath.com/platform/agentic-automation/agentic-orchestration)can simplify business, but managing[ dispar](https://www.uipath.com/platform/agentic-automation/agentic-orchestration)ate AI agents can also be a job in itself. UiPath’s platform helps businesses get their AI agents to work together. With the Maestro layer added to the platform this year, UiPath allows companies to “orchestrate” and manage a range of agents, including those built with third-parties, by ensuring access to the right data sets and enterprise systems, adherence to security guardrails, and adequate human oversight. “We put people in the conductor roles, and most of the operations work is done by agents and robots,” CEO Daniel Dines says. UiPath customers include banks, health insurers, and logistics providers.
> 智能代理 AI 可以简化业务,但管理分散的 AI 代理本身也是一项艰巨的任务。UiPath 平台帮助企业实现 AI 代理的协同工作。随着今年平台新增 Maestro 层,UiPath 允许企业“编排”和管理一系列代理,包括与第三方合作构建的代理,确保访问正确的数据集和企业系统、遵守安全防护措施以及充分的人工监督。“我们安排人员担任指挥,大部分运营工作由代理和机器人完成,”首席执行官 Daniel Dines 说道。UiPath 的客户包括银行、健康保险公司和物流供应商。
## **Warp Agentic Dev**elopment Environment - 专业人士的氛围编码
> The tr[end of vibe](https://time.com/7312641/agentic-ai-era-humans/) c[oding](https://time.com/7312641/agentic-ai-era-humans/)— tech novices using AI to write and refine code—hasn’t come without catches. For example: companies are now hiring engineers to fix errors in vibe-coded software. Warp has taken a different approach with an agent-based alternative to traditional coding interfaces. Launched in June, Warp’s agentic development environment (ADE) allows software engineers to task AI agents with developing their code, then intervene when they notice errors. “You get to see a really clear plan of what the agent is going to do, and you get to adjust that plan with the agent,” says Warp founder and CEO Zach Lloyd. “You're building stuff that's actually shippable.”
> 氛围编码(Vibe Code)的潮流——技术新手使用 AI 编写和优化代码——并非没有陷阱。例如:现在很多公司都在招聘工程师来修复氛围编码软件中的错误。Warp 另辟蹊径,推出了基于代理的传统编码界面替代方案。Warp 的代理开发环境(ADE)于今年 6 月上线,允许软件工程师委托 AI 代理开发代码,并在 AI 代理发现错误时进行干预。“你可以清晰地了解代理的执行计划,并根据计划进行调整,”Warp 创始人兼首席执行官扎克·劳埃德(Zach Lloyd)表示,“你构建的是真正可交付的产品。”
## WindBorne Systems Atlas - 填补天气预报的空白
> The best weather forecasting systems still lack data from large swaths of the planet’s atmosphere, such as over oceans where major storms often develop. WindBorne is closing data gap[s with Atlas,](https://windbornesystems.com/blog/windborne-breaks-new-ai-forecasting-records-with-weathermesh-2-model-surpassing-ai-and-physics-gold-standards) its growing constellation of long-lasting weather balloons that m[easu](https://windbornesystems.com/blog/windborne-breaks-new-ai-forecasting-records-with-weathermesh-2-model-surpassing-ai-and-physics-gold-standards)re temperature, wind speed, pressure, humidity, and other factors. The company feeds the data into its own AI model to produce forecasts more accurate than those of government agencies. This year, the National Oceanic and Atmospheric Administration (NOAA) began buying Atlas sensor data to help fill gaps in the agency’s forecasting capabilities, following Trump Administration cuts. Windborne CEO John Dean says he wants to expand the NOAA partnership, but that weather forecasts should remain a public good.
> 即使是最好的天气预报系统仍然缺乏来自地球大气大片区域的数据,例如经常发生重大风暴的海洋上空的数据。WindBorne 正在利用 Atlas 填补数据缺口。Atlas 是其不断壮大的长寿命气象气球群,用于测量温度、风速、气压、湿度和其他因素。该公司将数据输入自己的人工智能模型,以生成比政府机构更准确的预报。今年,在特朗普政府削减开支后,美国国家海洋和大气管理局 (NOAA) 开始购买 Atlas 传感器数据,以帮助填补该机构预报能力的缺口。Windborne 首席执行官约翰·迪恩表示,他希望扩大与 NOAA 的合作伙伴关系,但天气预报仍应作为公共产品。
# **Beauty 美容**
## L'Oreal AirLight Pro - 出色的红外线吹风机
> L’Oréal’s first-ever [pr](https://time.com/collection/best-inventions-2022/6229945/zuvi-halo/)ofessional hair dryer was designed in partnership with the startup Zuvi, which released a first-of-its-kind infrared hair dryer a few years ago. This machine, which uses both infrared light and conventional convection, goes further. With more than 150 patents, it features a 17-blade motor surrounded by tungsten-halogen bulbs that produce infrared light to dry hair faster than standard hair dryers. But hair-drying is about more than speed, as anyone who walks out of a salon with dry, frizzy hair can attest. L’Oréal says the AirLight Pro results in smoother hair than convection-only dryers, because infrared light efficiently dries hair surfaces while leaving internal moisture intact.
> 欧莱雅首款专业吹风机是与初创公司 Zuvi 合作设计的,后者几年前推出了首款红外线吹风机。这款吹风机结合了红外线和传统对流技术,更进一步。它拥有 150 多项专利,配备 17 片叶片电机,周围环绕着卤钨灯泡,可产生红外线,比标准吹风机更快地吹干头发。但吹干头发不仅仅取决于速度,任何一个从沙龙出来头发干燥卷曲的人都可以证明这一点。欧莱雅表示,AirLight Pro 比仅使用对流技术的吹风机能使头发更顺滑,因为红外线能有效地干燥头发表面,同时保持内部水分的完整。
## **BoldHue 入门套件** - 适合所有肤色的粉底打印机
> “We wear makeup because we want to feel confident, comfortable in our own skin, and included,” says BoldHue CEO and co-founder Rachel Wilson. It was this desire for complete representation that inspired the company’s foundation printer. Launched this spring, the countertop device scans your skin to create a custom shade in under one minute, dispensing personalized blends of a skincare-enriched base and a combination of five color pigments to match all skin tones (and change daily if you get some sun). The lightweight, buildable foundation has a dewy finish and removes all the guesswork from shade-matching.
> “我们化妆是因为我们想要自信、舒适地展现自己的肤色,并且融入其中,”BoldHue 首席执行官兼联合创始人 Rachel Wilson 说道。正是这种对完美展现自我的渴望,启发了该公司研发粉底打印机。这款台面设备于今年春季推出,它可以扫描你的皮肤,在一分钟内打造专属色号,并根据你的肤色调配出个性化的粉底液,包括富含护肤成分的粉底和五种色彩颜料的组合(如果你晒太阳,粉底液会每天更换)。这款轻盈易涂的粉底液拥有水润的妆效,让你无需费心费力地寻找合适的色号。
## Epres ePhD 键合修复指甲护理 - 角蛋白焕活剂
> Repeated polishing weakens fingernails by breaking down their keratin. But most nail-strengthening products on the market only work superficially, “like a landlord…painting over damage,” says Epres founder and doctor of materials science Eric Pressly. Pressly cofounded cult hair repair brand Olaplex a decade ago, and went on to launch Epres in 2022 based on his dozens of bond repair patents. The company’s new treatment uses just two ingredients—a synthetic form of ethyl acetate (found in fermenting fruits and vegetables) and the emollient diethylhexyl maleate—to repair the broken cross-linked bonds in nails, rebuilding them from within.
> 反复抛光会破坏指甲角蛋白,使其变得脆弱。但市面上大多数指甲强化产品的效果只是表面功夫,“就像房东……粉刷破损的墙面一样,”Epres 创始人兼材料科学博士埃里克·普雷斯利 (Eric Pressly) 说道。十年前,普雷斯利与他人共同创立了热门护发品牌 Olaplex,并于 2022 年凭借其数十项修复键专利创立了 Epres。该公司的新款护发产品仅使用两种成分——合成乙酸乙酯(存在于发酵水果和蔬菜中)和润肤剂马来酸二乙基己酯——来修复指甲中断裂的交联键,从内部重建它们。
## HigherDose 微电流身体塑形器 - 全身护肤设备
> Red light masks, gua sha, and microcurrent devices are popular home facial treatments, and now HigherDose has put them all together into one device for the body. Launched in June, the crescent-shaped handheld device—when rubbed over legs, abs, and more—supports lymphatic drainage, muscle recovery, and improved blood flow, with the goal of achieving a smoother, more toned appearance, according to the company. “We wanted to create something you’d actually reach for every day—a tool that feels spa-like but uses serious science to help people reconnect with their bodies,” says co-founder and co-CEO Lauren Berlingeri.
> 红光面膜、刮痧和微电流仪都是很受欢迎的家用面部护理产品,如今,HigherDose 将它们整合到一个身体护理设备中。这款新月形手持设备于今年六月上市,用于腿部、腹部等部位时,可以促进淋巴引流、肌肉恢复和改善血液循环,据该公司介绍,其目标是打造更光滑、更紧致的肌肤。“我们希望创造一款你每天都会用到的产品——一款感觉像水疗一样,但又运用严谨的科学原理,帮助人们重新与身体建立联系的工具,”联合创始人兼联合首席执行官劳伦·贝林杰里说道。
## L'Oréal Groupe Melasyl - 色素沉着过度的一大进步
> L’Oréal Group’s scientists spent 18 years researching and testing a new skincare ingredient that could help the millions of people worldwide who experience skin pigmentation issues. The result, launched in 2024, is Melasyl, a patented cosmetic molecule formulated to reduce the appearance of hyperpigmentation, improve skin tone, and even out the complexion. Unlike many ingredients that block tyrosinase, the enzyme tied to melanin production, Melasyl helps intercept melanin precursors before they become pigments that collect in the skin, according to L’Oréal Groupe. Melasyl is now incorporated into formulas across L’Oréal Groupe brands including Kiehl’s, Vichy, and La Roche-Posay.
> 欧莱雅集团的科学家们耗时 18 年,研发并测试了一种全新的护肤成分,旨在帮助全球数百万受色素沉着问题困扰的人们。这项成果于 2024 年推出,名为 Melasyl,这是一种获得专利的化妆品分子,旨在减少色素沉着,改善肤色,均匀肤色。欧莱雅集团表示,与许多阻断酪氨酸酶(一种与黑色素生成相关的酶)的成分不同,Melasyl 有助于在黑色素前体转化为色素并积聚在皮肤中之前将其拦截。目前,Melasyl 已被欧莱雅集团旗下科颜氏、薇姿和理肤泉等品牌的配方所采用。
## Pelage Pharmaceuticals PP405 - 逆转秃顶的疗法
> PP405 is a topical, non-hormonal treatment that activates dormant stem cells in hair follicles to regrow hair back to fullness. Clinical trials have shown success, though the drug may not work in the end stages of balding if the follicle is scarred. Pelage Pharmaceuticals is still awaiting further trial results before it can receive FDA approval, but the drug’s success could open doors for future therapies. “It’s not covering up the symptoms, it’s targeting the underlying biology,” says Pelage Pharmaceuticals chief medical officer Christina Weng.
> PP405 是一种局部非激素疗法,可激活毛囊中休眠的干细胞,使头发重新长出。临床试验已证明该药物有效,但如果毛囊受损,该药物可能无法在秃顶的末期发挥作用。Pelage Pharmaceuticals 仍在等待进一步的试验结果,之后才能获得 FDA 的批准,但该药物的成功可能为未来的疗法打开大门。“它不是在掩盖症状,而是针对潜在的生物学机制,”Pelage Pharmaceuticals 首席医疗官 Christina Weng 说道。
## **Philips Norelco **i9000 Prestige Ultra - 更贴面的剃须
> This electric shaver introduces SenseIQ Pro, a new version of Philips Norelco’s AI-backed technology that helps users find the right shaving pressure via LED guidance lights (orange means too hard, green is just right). Also new is the i9000’s Triple Action Lift & Cut system, which lifts hair from its root to cut it just below the skin’s surface, up to -.08mm. Flexible heads adapt to facial curves to shave hard-to-reach areas, different modes handle everything from thick beards to foam, and, in another first, the charging station’s hood sanitizes the shaver with UV light while the battery refills.
> 这款电动剃须刀搭载了飞利浦 Norelco 人工智能技术的全新版本 SenseIQ Pro,可通过 LED 指示灯帮助用户找到合适的剃须压力(橙色表示用力过大,绿色表示力度适中)。i9000 还配备了三重提剪系统,可从根部提起毛发,将其剪至皮肤表层以下,深度可达 -0.08 毫米。灵活的刀头可贴合面部曲线,轻松剃除难以触及的区域;多种剃须模式,从浓密的胡须到泡沫,都能轻松应对;此外,充电座的遮光罩可在电池充电时使用紫外线对剃须刀进行消毒,这也是 i9000 的又一项创新。
## **Shark CryoGlow** - 冷却 LED 面膜
> To design its first skincare product, SharkNinja convened panels of dermatologists, aestheticians, behavior scientists, and “skinfluencers,” says Danielle Lessing, SVP of global product development. Hundreds of prototypes and multiple clinical studies resulted in the CryoGlow LED face mask. Like other LED masks, it uses three types of light to kill acne-causing bacteria and stimulate collagen production, which reduces fine lines; unlike other LED masks, it has cold metallic plates under the eyeholes to simultaneously reduce redness and puffiness. The team took design cues from ski goggles and VR headsets, Lessing says, to make sure the mask would fit snugly yet comfortably.
> SharkNinja 全球产品开发高级副总裁 Danielle Lessing 表示,为了设计其首款护肤产品,他们召集了皮肤科医生、美容师、行为科学家和“皮肤影响者”等专家组成的专家小组。数百个原型和多项临床研究最终催生了 CryoGlow LED 面膜。与其他 LED 面膜一样,它使用三种光线来杀死致痘细菌并刺激胶原蛋白生成,从而减少细纹;与其他 LED 面膜不同的是,它在眼窝下方设有冷金属板,可同时减少红肿。Lessing 表示,团队从滑雪镜和 VR 头戴设备中汲取了设计灵感,以确保面膜佩戴舒适贴合。
## Therabody TheraFace 去浮肿棒 - 用于放松
> After consume[rs started usi](https://www.therabody.com/blogs/news/theraface-depuffing-wand-clinically-proven-to-enhance-skin-health-according-to-new-study)ng the heavy-duty TheraGun on their face, the compan[y fi](https://www.therabody.com/blogs/news/theraface-depuffing-wand-clinically-proven-to-enhance-skin-health-according-to-new-study)gured it should make a face-focused product that massages and decreases swelling. The result is TheraFace Depuffing Wand, which features hot settings that increase blood flow and cold settings—no refrigeration required—that “seal in the benefits of that fluid movement” to soothe and firm faces, says Tim Roberts, TheraBody’s VP of science and innovation. The device, which is contoured to fit under-eye grooves, decreased under-eye puffiness in a company-sponsored clinical study. But it also just serves as an ultra-relaxing bit of self-care.
> 在消费者开始在脸上使用 TheraGun 高效面部按摩器后,该公司认为应该生产一款专注于面部的产品,用于按摩和消肿。于是, TheraFace 消肿棒应运而生。TheraFace 消肿棒具有热敷和冷敷两种功能,热敷可增加血液流动,冷敷无需冷藏,TheraBody 的科学与创新副总裁 Tim Roberts 表示,冷敷可“锁住液体流动的益处”,舒缓和紧致面部。这款设备的轮廓设计贴合眼底凹槽,在公司赞助的一项临床研究中,它确实减少了眼底浮肿。但它也是一种超级放松的自我护理产品。
## **Ulike Air 10** - 触感凉爽的激光脱毛
> Laser hair removal is one of the most popular cosmetic procedures in the U.S.—and while generally considered safe, both in-office and at-home treatments can cause irritation. Launched last year, Ulike’s Air 10 is the first at-home intense pulsed light (IPL) device to incorporate proprietary cooling technology that maintains a contact temperature of 65 degrees Fahrenheit, reducing painful side effects for even sensitive skin types. The device’s built-in SkinSensor also detects different skin tones and adjusts the intensity of each pulse accordingly. The Ulike Air 10 claims a 96% hair density reduction in just two weeks.
> 激光脱毛是美国最受欢迎的美容手术之一——虽然普遍认为安全,但无论是在诊所还是在家进行,都可能引起刺激。Ulike Air 10 于去年推出,是首款采用专有冷却技术的家用强脉冲光 (IPL) 设备,该技术可将接触温度保持在 65 华氏度(约 19 摄氏度),即使是敏感肌肤也能减少疼痛的副作用。该设备内置的 SkinSensor 传感器还能检测不同的肤色,并相应地调整每次脉冲的强度。Ulike Air 10 声称,仅用两周时间,毛发密度就能减少 96%。
# Connectivity & Communication 连接性
## Cailabs Tilba-L10 - 来自太空的激光通信
> Modern-day satellites communicate with the ground in a decidedly un-modern way—via radio. France-based Cailabs’ Tilba-L10 laser ground station avoids radio’s downsides. Its optical technology is not disrupted by foul weather, is harder for hostile actors to detect and jam, and has a massive carrying capacity. At the most commonly used frequency, radio waves can typically transmit 1 to 2 gigabits per second (gbps). Tilba-L10 can transmit up to 20 gbps in communication with laser-equipped satellites. “When you go optical, you get much more bandwidth that you can play with,” CEO Jean-Francois Morizur says. Launched in Nov. 2024, Cailabs now has buyers in countries including Australia, France, and the U.S.
> 现代卫星与地面的通信方式显然非现代方式——无线电。总部位于法国的 Cailabs 公司开发的 Tilba-L10 激光地面站则避免了无线电的缺点。其光学技术不受恶劣天气干扰,更难被敌方探测和干扰,并且拥有巨大的承载能力。在最常用的频率下,无线电波的传输速度通常为每秒 1 到 2 千兆比特 (gbps)。Tilba-L10 与配备激光的卫星通信时,传输速度高达 20 gbps。首席执行官 Jean-Francois Morizur 表示:“采用光学技术,可以获得更大的带宽。” Cailabs 于 2024 年 11 月正式投入运营,目前在澳大利亚、法国和美国等国家都有客户。
## **Crowd Compass** - 寻找朋友
> Chris Dimoff was at a packed music festival when he thought of Crowd Compass, a friend-finding tool for events where cellphone networks are overwhelmed. “I lost my friends for half the night because my phone had no service,” says CEO Dimoff. His solution, launched in 2024, is a battery-powered, water-resistant device that uses GPS and long-range mesh radio technology to guide users to each other—no cell or Wi-Fi network required. Each LED on Crowd Compass represents another device in the paired group, adjusting in real-time as users move. The devices can also show nearby emergency services, and allow no-service messaging.
> 克里斯·迪莫夫(Chris Dimoff)在一场人头攒动的音乐节上,突然想到了 Crowd Compass,这是一款专为手机网络不堪重负的活动而设计的交友工具。“我因为手机没信号,半夜都找不到朋友了,”首席执行官迪莫夫说道。他的解决方案于 2024 年推出,是一款电池供电的防水设备,利用 GPS 和远程网状无线电技术引导用户找到彼此——无需手机或 Wi-Fi 网络。Crowd Compass 上的每个 LED 灯代表配对组中的另一个设备,并会随着用户的移动实时调整。这些设备还可以显示附近的紧急服务,并允许在无信号时发送消息。
## Microsoft Hollow Core Fiber - 微软空心纤维-更快的数据传输
> Data tra[vels a](https://www.nature.com/articles/s41566-025-01747-5)cr[oss](https://www.nature.com/articles/s41566-025-01747-5) the cloud mainly as light via optical fibers made from solid glass. But that light—and thus that data—travels faster through air. “With hollow core fiber, the glass [has] an air core in the middle,” says Frank Rey, General Manager of Azure Hyperscale Networking at Microsoft, which this year showed that its hollow-core fiber achieved the lowest signal loss ever. “And because we can use more parts of the optical spectrum to send data, the transmission and overall total capacity is improved.” Current hollow-core fibers extend data transmission up to 1.5 times the distance of today's technology. Microsoft has more than 2,000 kilometers of fiber in production in Europe, mainly as interconnections between data centers, with over 12,000 kilometers planned for deployment in the next year.
> 数据主要以光的形式通过由实心玻璃制成的光纤在云端传输。但光(以及数据)在空气中传播速度更快。“空芯光纤的玻璃中间有一个空气芯,”微软 Azure 超大规模网络总经理 Frank Rey 说道。微软今年展示了其空芯光纤,实现了有史以来最低的信号损耗。“而且由于我们可以使用更多光谱部分来发送数据,传输量和总容量都得到了提升。”目前的空芯光纤可将数据传输距离延长至当今技术的 1.5 倍。微软在欧洲已生产超过 2,000 公里的光纤,主要用于数据中心之间的互连,并计划在明年部署超过 12,000 公里的光纤。
## Netgear Nighthawk M3 - 5G 旅行热点
> Getting a good signal while traveling can be nearly impossible. Netgear’s Nighthawk M3 is a portable Wi-Fi router with immense power—providing 5G internet at up to 2.5 Gbps, to up to 32 devices, with a 13-hour battery. The device works with any mobile carrier across 140 countries, including the U.S., “so travellers don’t have to do anything,” says Netgear product line manager Arodi Dalpathadu. Ports support antennas to boost signal in rural spots, or add Ethernet if needed. It also moonlights as a power bank. The Nighthawk M3 is currently available in most of the world, with a similar U.S. release by early 2026.
> 旅行时想要获得良好的信号几乎是不可能的。Netgear 的 Nighthawk M3 是一款功能强大的便携式 Wi-Fi 路由器,可提供高达 2.5 Gbps 的 5G 网络,最多可连接 32 台设备,并配备 13 小时的电池续航时间。该设备兼容包括美国在内的 140 个国家/地区的任何移动运营商,“因此旅行者无需做任何事情,”Netgear 产品线经理 Arodi Dalpathadu 说道。端口支持天线,可在农村地区增强信号,或根据需要添加以太网。它还可以兼作移动电源。Nighthawk M3 目前已在全球大部分地区上市,类似型号将于 2026 年初在美国上市。
# Consumer Electronics 消费电子
## 70mai Dash Cam 4K Omni - 更智能的事故检测
> In response to unpredictable urban traffic, several consumer dash cams promise video coverage by merging footage from two fixed cameras into a distorted fish-eye view that’s prone to split-second delays. Launched in May, 70mai’s Dash Cam 4K Omni offers a single intelligent eye. Rotating a full 360 degrees, the camera combines magnetic sensor-directed gimbals and AI-powered motion detection to spot trouble in real time and record with greater precision. (Recording can be turned off at any time.) “If you’re in a supermarket when someone hits your car, this device will notice, lock onto the other car, record high-definition evidence, and send an alert to your phone,” says product manager Zhiyi Liu.
> 为了应对变幻莫测的城市交通状况,一些消费级行车记录仪声称,它们会将两个固定摄像头的画面合并成一个扭曲的鱼眼视图,从而实现视频覆盖,但这种视图容易出现瞬间延迟。70 迈于今年 5 月推出的 4K 全向行车记录仪,配备了一颗智能摄像头。这款行车记录仪可 360 度旋转,结合了磁力传感器控制的万向节和人工智能驱动的运动检测功能,可以实时发现问题并更精确地录制。(录制功能可随时关闭。)“如果你在超市购物时,有人撞到了你的车,这款设备会注意到,锁定对方车辆,录制高清证据,并向你的手机发送警报,”产品经理刘志毅说道。
## **Antigravity A1** - 沉浸式 360 度无人机摄像头
> Antigravity isn’t the first company to affix a 360-degree camera to a drone, but it calls itself the first to create a drone designed around one from the outset. The A1 ships with a pair of head-tracking goggles and a reimagined controller that can be used with one hand. That means pilots can get a drone’s eye view in any direction they like, creating a more immersive experience. And because the A1 weighs just 249 grams, U.S. buyers—and those in most other markets—won’t need to be licensed drone operators to fly one.
> Antigravity 并非第一家在无人机上安装 360 度摄像头的公司,但它自称是第一家从一开始就围绕 360 度摄像头打造无人机的公司。A1 配备一副头部追踪眼镜和一个重新设计的单手操控控制器。这意味着操控者可以从任何方向获取无人机的视角,从而打造更加沉浸式的体验。由于 A1 重量仅为 249 克,美国以及其他大多数市场的买家无需持有无人机操作执照即可驾驶。
## Apple AirPods Pro 3 - 耳中的实时翻译
> At a certain price point, active noise cancellation earbuds perform pretty similarly. But Apple’s AirPods Pro 3, announced in September, are “a massive leap forward,” says John Ternus, Apple’s senior vice president of hardware engineering. Beyond removing twice as much background noise as the previous generation of AirPods Pro, tracking wearers’ heart rate using a photoplethysmography pulse sensor, and serving as a hearing aid if needed, the headphones’ new Live Translation feature can interpret a conversation between French, German, Portuguese, Spanish, or English-speaking friends instantly using Apple Intelligence. Italian, Japanese, Korean, and Chinese are coming by year’s end.
> 在特定价位上,主动降噪耳机的表现相当相似。但苹果硬件工程高级副总裁约翰·特纳斯 (John Ternus) 表示,苹果 9 月发布的 AirPods Pro 3 是“一次巨大的飞跃”。除了比上一代 AirPods Pro 消除两倍的背景噪音、使用光电容积脉搏传感器追踪佩戴者的心率,并在需要时充当助听器之外,这款耳机新增的实时翻译功能还可以利用 Apple Intelligence 即时翻译法语、德语、葡萄牙语、西班牙语或英语朋友之间的对话。意大利语、日语、韩语和中文版本将于年底推出。
## Belkin Stage PowerGrip - 指向充电
> This handy smartphone accessory does double duty while magnetically attached to a smartphone. It’s a backup battery that can wirelessly recharge phones (and other devices via a retractable cable and USB port). And it’s a content creation tool, mimicking the shape of an old-school camera to make it easier to point and shoot, and with a big Bluetooth-enabled shutter button. It’s made for content creators on the go, says Belkin’s Logan Olson, and it turns out that’s “a large segment of people.” The Powergrip can also function as a phone stand and is tripod-compatible.
> 这款便捷的智能手机配件磁吸式吸附在智能手机上,兼具双重功能。它既是备用电池,可以为手机无线充电(也可以通过伸缩线缆和 USB 接口为其他设备充电)。它同时也是一款内容创作工具,模仿老式相机的造型,方便对准和拍摄,并配有一个支持蓝牙的大型快门按钮。Belkin 的 Logan Olson 表示,这款产品专为忙碌的内容创作者打造,事实证明,这类人群“占了很大一部分”。Powergrip 还可以用作手机支架,并兼容三脚架。
## Belkin Switch 2 充电盒 - 延长游戏时间
> [T](https://bsky.app/profile/matpiscatella.bsky.social/post/3lun37i6gok2k)he Nintendo Switch 2 is the fastest-selling video game hardware device in U.S. history. There’s just one problem: the on-the-go console runs out of juice often. “We knew battery, which was already an issue on the Switch 1, was going to be even more of an issue on the Switch 2,” says Logan Olson, Belkin’s director of product management for future ventures. Belkin, a third-party tech accessories firm, made a charging case for the console with a removable 10,000mAh power bank—enough to recharge the handheld 1.5 times. The case also has space for 12 game cards and an AirTag.
> 任天堂 Switch 2 是美国历史上销售最快的电子游戏硬件设备 。但它有一个问题:这款便携游戏机经常会没电。“我们知道电池问题在 Switch 1 上就已经是个问题,而 Switch 2 上的问题会更加严重,”贝尔金未来产品管理总监 Logan Olson 说道。第三方科技配件公司贝尔金为这款游戏机制作了一个充电盒,带有一个可拆卸的 10,000 毫安时移动电源,足以为这款掌上游戏机充电 1.5 次。充电盒还可以容纳 12 张游戏卡和一个 AirTag。
## **Biwin Mini SSD** - 小驱动器中的大存储
> Ti[ny gadge](https://www.biwintechnology.com/product/mini-ssd/)ts and handheld c[onsoles ](https://www.biwintechnology.com/product/mini-ssd/)need desktop-level storage, but a whole lot smaller. Biwin’s Mini SSD crams up to 2TB of storage into an NVMe drive the size of a micro-SIM card. “We brought this thing down to the size of a coin,” says Will Lin, director of Biwin Storage Technology USA. Its 15mm by 17mm by 1.4mm land-grid-array slab has 3,700 MB/s of read speed in a tiny footprint. The drive comes in three sizes: 512GB, 1TB, and 2TB. While Lin can’t disclose clients, major gaming handheld manufacturer GPD has said publicly that it’s already using the Biwin Mini SSD.
> 微型设备和手持游戏机需要桌面级的存储空间,但容量要小得多。Biwin 的 Mini SSD 可将高达 2TB 的存储空间塞进一个微型 SIM 卡大小的 NVMe 硬盘中。“我们把它缩小到了硬币大小,”Biwin Storage Technology USA 总监 Will Lin 说道。它采用 15 毫米 x 17 毫米 x 1.4 毫米的平面栅格阵列板,在极小的空间内实现了 3,700 MB/s 的读取速度。该硬盘有三种容量:512GB、1TB 和 2TB。虽然 Lin 无法透露客户,但大型游戏手持设备制造商 GPD 已公开表示,他们已经在使用 Biwin Mini SSD。
## **Camp Snap** - 无屏幕数码相机
> Nostalgic for childhood summers taking photos without filters, parents Brian and Melanie Waldman created Camp Snap, a kid-friendly, screen-free digital camera. A modern take on film and disposable cameras, the Snap is a point and shoot that takes 500 shots per USB-C charge. With schools and summer camps increasingly adopting screen-free policies, the camera provides a valuable alternative. “We wanted our own kids to experience that freedom while still capturing memories,” says Brian, the company’s CEO. This year, the company added a Pro version and a screen-free digital video camera to its lineup.
> 怀念童年夏天无滤镜拍照的时光,父母布莱恩和梅兰妮·沃尔德曼发明了 Camp Snap,这是一款儿童友好型无屏幕数码相机。Snap 是对胶卷和一次性相机的现代诠释,是一款傻瓜相机,每次通过 USB-C 充电可拍摄 500 张照片。随着学校和夏令营越来越多地采用无屏幕政策,这款相机提供了一个宝贵的替代方案。“我们希望我们的孩子也能体验到这种自由,同时还能捕捉美好的回忆,”公司首席执行官布莱恩说道。今年,公司在其产品线中新增了 Pro 版本和无屏幕数码摄像机。
## Fujifilm Instax Wide Evo - 模拟与数字的结合
> This [camera combines](https://www.instaxus.com/cameras/instax-wide-evo/) [slick di](https://www.instaxus.com/cameras/instax-wide-evo/)gital features with instant photography nostalgia, letting you hold memories nearly as fast as you can capture (and filter) them. Building on its Mini Evo smartphone printer, the Instax Wide Evo features a 15.67 mm extra-wide lens, the ability to customize light and color gradient using “degree control,” and 10 additional lens effects. Users can snap their own pictures or upload them via Bluetooth, then make adjustments on the 3.5-inch LCD screen before using the “print crank” to physically begin the printing process.
> 这款相机将精巧的数码功能与即时摄影的怀旧感完美结合,让您几乎可以像捕捉(和过滤)回忆一样快速地留住它们。Instax Wide Evo 以 Mini Evo 智能手机打印机为基础,配备 15.67 毫米超广角镜头,能够通过“度数控制”自定义光线和色彩渐变,并新增 10 种镜头效果。用户可以自行拍摄照片或通过蓝牙上传,然后在 3.5 英寸 LCD 屏幕上进行调整,最后使用“打印曲柄”开始打印。
## Hisong AirStudio S1 - 无线音乐制作
> Most studios are full of cables and cords connecting mics, mixers, and monitors. This “mobile recording capsule” reimagines recording for the wireless age, integrating condenser and enhanced dynamic microphones, wireless in-ear monitors, and an audio interface. The AirStudio S1’s low wireless latency makes it possible to create studio-grade recordings anywhere, Hisong claims. Every musician should “experience the joy of creating music without wires, complicated setups, or technical hurdles—just pure creativity,” founder Carlos Ye says. (A companion app supports advanced mixing functions; the product is compatible with audio mixing software like Pro Tools and Garage Band.)
> 大多数录音棚里都堆满了连接麦克风、调音台和监听音箱的线缆。这款“移动录音舱”重新定义了无线时代的录音方式,集成了电容式麦克风、增强型动圈麦克风、无线入耳式监听音箱以及音频接口。Hisong 声称,AirStudio S1 的低无线延迟使其能够在任何地方进行录音棚级录音。创始人 Carlos Ye 表示,每位音乐人都应该“体验无需线缆、复杂设置或技术障碍即可创作音乐的乐趣——纯粹的创造力”。(配套应用程序支持高级混音功能;该产品兼容 Pro Tools 和 Garage Band 等音频混音软件。)
## Huawei Pura 80 Ultra - 尖端的智能手机摄像头
> Huawei’s Pura 80 Ultra is a smartphone for people who mostly use theirs for documenting the world around them. “We’ve developed an amazing camera that also happens to be a smartphone,” says Andreas Zimmer, Huawei’s head of product in Europe. Launched in July and featuring an industry-first switchable dual telephoto camera, the Pura 80 Ultra mimics the mechanics of a digital camera in miniature. Its two lenses offer 3.7x and 9.4x magnification for sharper shots, its one-inch sensor captures more light, and it can distinguish 1.5 million colors. The result? Richly detailed, vibrantly colored photos and videos in any lighting.
> 华为 Pura 80 Ultra 是一款专为那些主要用手机记录周围世界的人设计的智能手机。“我们开发了一款令人惊叹的相机,它恰好也是一款智能手机,”华为欧洲产品负责人 Andreas Zimmer 说道。Pura 80 Ultra 于今年 7 月上市,搭载业界首款可切换的双长焦摄像头,其结构模拟了微型数码相机的原理。它的两个镜头分别提供 3.7 倍和 9.4 倍的放大倍率,可拍摄出更清晰的照片;其 1 英寸传感器可捕捉更多光线,并能区分 150 万种颜色。效果如何?在任何光线下都能拍出细节丰富、色彩鲜艳的照片和视频。
## Littpopo MicroCam X1 - 袖珍显微镜摄像头
> Watchi[ng their yo](https://littpopo.com/products/digital-microscope-camera)un[g ](https://littpopo.com/products/digital-microscope-camera)daughter invent fairytale worlds around fallen leaves, parents-turned-founders Eva Hu and Sam Chan set out to lure kids off couches and into nature with a tool that rewards curiosity rather than screen time. The MicroCam X1 packs a 400x digital microscope, 3-centimeter macro lens, and 4K video camera into a 160 gram, drop-proof shell. “We wanted the device to be very tough for backyard or outdoor exploration,” Hu says. The intuitive design—you twist the camera barrel 180 degrees to swap modes—makes it easy to capture microscopic movies on a palm-sized display. Littpopo has already shipped about 2,000 units to families and classrooms.
> 看着年幼的女儿在落叶周围编织出一个个童话世界,由父母转型为创始人的 Eva Hu 和 Sam Chan 决定用一款激发好奇心而非沉迷于屏幕的工具,吸引孩子们离开沙发,走进大自然。MicroCam X1 将 400 倍数码显微镜、3 厘米微距镜头和 4K 摄像机集成在一个 160 克的防摔外壳中。“我们希望这款设备非常坚固耐用,适合在后院或户外探险,”Eva Hu 说道。这款设备设计直观——只需旋转 180 度即可切换模式——只需在掌上显示屏上轻松捕捉微观影像。Littpopo 已向家庭和课堂售出约 2,000 台。
## Nothing Headphone (1) - 声音和设计的清晰度
> Hig[h-end headpho](https://us.nothing.tech/products/headphone-1)[nes tend to b](https://us.nothing.tech/products/headphone-1)e made of lightweight plastics in neutral colors. British brand Nothing eschews this mass-market logic with its Headphone (1), over-ear headphones with rectangular, translucent earcups and metal components. Veteran audio firm KEF helped make the headphones sound superb, while Nothing’s industrial designers ensured every physical control is distinguishable by touch alone. Co-founder and CEO Carl Pei describes Nothing’s design aesthetic as “retrofuturistic engineering meets human warmth,” and says most of the company’s customers are young creatives. “We don't have to be liked by everybody,” Pei says, “But we have to have a group of people who really love us.”
> 高端耳机往往采用中性色的轻质塑料制成。英国品牌 Nothing 的 Headphone (1) 则打破了这种大众市场逻辑。这款头戴式耳机采用矩形半透明耳罩和金属部件。老牌音响公司 KEF 助力打造出这款音质卓越的耳机,而 Nothing 的工业设计师则确保每个物理控制按钮都可以通过触摸轻松区分。联合创始人兼首席执行官 Carl Pei 将 Nothing 的设计美学描述为“复古未来主义工程与人性化温暖的结合”,并表示公司的大部分客户都是年轻的创意人士。“我们不必让每个人都喜欢我们,”Pei 说,“但我们必须拥有一群真正爱我们的人。”
## **Pentax 17** - 适合智能手机一代的有趣胶片照片
> Pe[ntax is t](https://pentax.eu/products/pentax-17)[he fir](https://pentax.eu/products/pentax-17)st major camera maker to release a new 35mm film camera in almost two decades. The Pentax 17 is a half-frame camera, so users get 72 shots from a 36-exposure film, and its vertical orientation is ideally suited to a generation whose default camera is a smartphone. “This is a quality product designed to give you many years of pleasure,” says Ken Curry, president of Pentax owner Ricoh Imaging North America. Having to wait for your film to be developed is part of the appeal, Curry says. “Delayed gratification is a novelty these days.”
> 宾得是近二十年来首家推出全新 35 毫米胶片相机的大型相机制造商。 宾得 17 是一款半画幅相机,用户可以使用 36 张胶片拍摄 72 张照片,其竖屏模式非常适合以智能手机为默认相机的一代人。宾得母公司理光影像北美总裁肯·库里表示:“这是一款高品质产品,旨在为您带来多年的愉悦体验。”库里表示,等待胶片冲洗的过程也是其吸引力之一。“如今,延迟满足是一种新鲜事物。”
## Samsung Micro RGB - 超逼真的电视
> Most premium TVs still rely on a single, large white or blue backlight filtered through color layers, a setup that can mute vibrancy and waste energy. Samsung’s new Micro RGB TV instead uses individually controlled red, green, and blue LEDs tens of microns wide, giving richer, more lifelike colors and cutting power use by 20%. “Micro RGB is a breakthrough in premium TV technology,” says Taeyong Son, EVP of Samsung’s Visual Display Business. The first set of Micro RGB TVs ship this year for $29,999 and render images nearly indistinguishable from real life. Samsung’s glare-free glass and an on-board AI engine further refine each scene’s crispness and color.
> 大多数高端电视仍然依赖于单一、大的白色或蓝色背光,并通过色彩层进行过滤,这种设置会降低画面的活力并浪费能源。三星新款 Micro RGB 电视则采用了数十微米宽的红、绿、蓝三色 LED 灯珠,分别独立控制,呈现出更丰富、更逼真的色彩,并将功耗降低 20%。“Micro RGB 是高端电视技术的一次突破,”三星视觉显示业务执行副总裁孙泰勇表示。首批 Micro RGB 电视将于今年上市,售价 29,999 美元,其呈现的图像几乎与真实画面难以区分。三星的防眩光玻璃和内置 AI 引擎进一步优化了每个场景的清晰度和色彩。
## Shokz OpenRun Pro 2 - 更高水平的骨传导耳机
> Bone conduction headphones—which keep the ear canal open so listeners can enjoy music while staying aware of their surroundings—are having a moment. But the trade-off has historically been audio quality, especially bass. Shokz’s OpenRun Pro 2 “solves a long-standing problem of having to compromise either situational awareness or immersive audio,” says Shokz spokesperson Jayme Schwartz. The standout feature is the brand’s new DualPitch technology, which combines bone conduction for crisp mids and highs with air conduction for richer lows. Since launching in August 2024, Shokz has sold 630,000 units in North America and 1.8 million globally.
> 骨传导耳机——保持耳道畅通,让听众在欣赏音乐的同时还能感知周围环境——正风靡一时。但一直以来,这种耳机的音质,尤其是低音,一直是其痛点。Shokz 发言人 Jayme Schwartz 表示,Shokz 的 OpenRun Pro 2“解决了长期以来必须在情境感知和沉浸式音频之间做出妥协的问题”。该品牌的全新 DualPitch 技术尤为突出,它将骨传导技术(带来清脆的中音和高音)与气导技术(带来更浑厚的低音)相结合。自 2024 年 8 月上市以来,Shokz 在北美已售出 63 万台,全球销量达 180 万台。
## Tecno Megabook S14 - 羽量级笔记本电脑
> Weighing in at less than 2 lbs., this Chinese-made 14-inch OLED laptop stakes a claim as the lightest laptop on the market. (Apple’s 13-inch MacBook Air weighs 2.7 lbs.) But the device offers more than just that superlative. The S14 comes with Tecno’s proprietary AI model, which can perform AI-assisted tasks like meeting transcriptions, document analysis, and text- and voice-assisted photo search—all without an internet connection. “What sets this product apart is its ability to work intelligently even offline—whether you’re on a plane, in a remote village, or simply prioritizing privacy,” says Daniel Kang, Tecno’s PC product director.
> 这款中国制造的 14 英寸 OLED 笔记本电脑重量不到 2 磅,堪称市面上最轻的笔记本电脑。(苹果 13 英寸 MacBook Air 重 2.7 磅。)但这款设备的功能远不止如此。S14 搭载了 Tecno 专有的 AI 模型,可以执行 AI 辅助任务,例如会议记录、文档分析以及文本和语音辅助的照片搜索——所有这些都无需互联网连接。“这款产品的与众不同之处在于它即使在离线状态下也能智能工作——无论您是在飞机上、在偏远的村庄,还是仅仅在需要保护隐私的情况下,”Tecno 的 PC 产品总监 Daniel Kang 说道。
## The Light Phone III - 无干扰的 5G 手机
> Light co-founder Kaiwei Tang used to work for Nokia, but “I quit my job because I don’t see the point of making a new phone every six months,” he says. Light makes minimalist devices. Its previous phones could do little more than make calls or texts, with an e-ink display and multi-day battery life. Launched in April, the Light Phone III also pares back functionality to minimize distractions, but has more of the features customers expect from a modern-day phone, including a camera, basic GPS navigation, 5G hotspot capabilities, and a Yellow Pages-like directory—but no browser or social media apps.
> Light 联合创始人唐凯伟曾在诺基亚工作,但“我辞职了,因为我觉得每六个月就推出一款新手机毫无意义,”他说。Light 致力于打造极简主义的设备。其之前的手机除了打电话和发短信之外,几乎没有其他功能,配备电子墨水显示屏和长达数天的电池续航时间。今年 4 月推出的 Light Phone III 也削减了功能以最大程度地减少干扰,但拥有更多用户对现代手机的期望,包括摄像头、基本的 GPS 导航、5G 热点功能以及类似黄页的目录——但没有浏览器或社交媒体应用程序。
## Unihertz Jelly Star - 非常小的智能手机
> The Jelly Star is proof that smartphones don’t have to look the same. Chinese company UniHertz bills the device as the world’s smallest Android phone; with a three-inch display, it’s about the size of a credit card. The mobile market is “overwhelmed with large screens,” UniHertz CEO Stephen Xu says. But Jelly Star also stands out with a backside featuring a colorful translucent casing and LED light that pulses in sync with ringtones, notification sounds and music. Although it can operate the same apps as a full-sized smartphone, some users are embracing the tiny screen as a way to limit their scrolling.
> Jelly Star 证明了智能手机不必千篇一律。中国公司 UniHertz 称其为全球最小的安卓手机;它配备三英寸显示屏,大小与信用卡相当。UniHertz 首席执行官 Stephen Xu 表示,移动市场“充斥着大屏幕”。但 Jelly Star 的背面也同样引人注目,它采用彩色半透明外壳,并配有 LED 灯,可与铃声、通知音和音乐同步闪烁。虽然它可以运行与全尺寸智能手机相同的应用程序,但一些用户仍然喜欢小屏幕,因为它可以减少滚动屏幕的次数。
# Crypto & Blockchain 加密与区块链
## **Swear** - 防篡改视频认证
> Deepfake disinformation erodes public trust. Swear’s digital DNA fingerprints every pixel, audio sample, and metadata in real time when you take a video, and writes the hashes to the blockchain, so any later tweak—even one single bit—shows up instantly. The tech only adds a megabyte of data per hour of footage, so bodycams and CCTV can adopt it with no hardware changes. “If you’re going to become the internet’s notary, you have to put your stake on the strongest technologies,” says founder Jason Crawforth. Swear is piloting with U.S. security companies like Milestone, Axis, and ESI Convergent, and aims to bake its hashes into every smartphone camera next.
> Deepfake 虚假信息侵蚀公众信任。Swear 的数字 DNA 会在用户拍摄视频时实时记录每个像素、音频样本和元数据,并将哈希值写入区块链,因此任何后续调整——哪怕只有一比特——都会立即显示。该技术每小时拍摄的视频仅增加 1MB 的数据,因此执法记录仪和闭路电视监控系统无需任何硬件改动即可采用。“如果你想成为互联网的公证人,就必须押注于最强大的技术,”创始人 Jason Crawforth 说道。Swear 正在与 Milestone、Axis 和 ESI Convergent 等美国安全公司合作进行试点,并计划将其哈希值嵌入到每部智能手机摄像头中。
# **Design 设计**
## Aurzen Zip 三折便携式迷你投影仪 - 随时随地的娱乐
> From wallets to laptops, the key to portability is foldability. Entertainment is no exception, according to projection technology company Aurzen, whose new pocket-sized Aurzen Zip tri-fold projector puts projection in the palm of your hand. It features a patented Z-shaped design, Wi-Fi-free screen mirroring, zero-latency auto-focus, a full-screen vertical mode tailored to playing TikToks, and it unfolds into a built-in adjustable stand that makes tripods obsolete. “Whether I’m projecting a family slideshow or sharing a quick game session with friends on a road trip, Zip turns ordinary moments into shared adventures,” says Mike Zeng, Zip’s product director.
> 从钱包到笔记本电脑,便携性的关键在于可折叠性。投影技术公司 Aurzen 表示,娱乐领域也不例外。该公司全新推出的袖珍型 Aurzen Zip 三折投影仪,让投影体验尽在掌中。它采用获得专利的 Z 形设计,支持 Wi-Fi 无线屏幕镜像、零延迟自动对焦、专为播放抖音短视频定制的全屏竖屏模式,并可展开成内置可调节支架,让三脚架成为过去。Zip 产品总监 Mike Zeng 表示:“无论是投影家庭幻灯片,还是在旅途中与朋友快速分享游戏,Zip 都能将平凡的瞬间变成共同的冒险。”
## **Hedgehog Go** - 功能强大的旅行尺寸吹风机
> The[ discomfort](https://us.hedgehogdryer.com/products/hedgehog-go-new) of squelchy wet s[ocks or dam](https://us.hedgehogdryer.com/products/hedgehog-go-new)p gear can be an offputting problem during outdoor sports, but travel-sized dryer Hedgehog Go, which can be used on boots, gear, and hair, offers solace. The 12.3 oz. dryer with adjustable heat settings pushes out air at more than 60 m.p.h. through its 105,000 rpm fan, and comes with interchangeable nozzles. “We have 11 patents on the different systems we use,” says Hedgehog founder Bjorn Holte. The device was funded through Kickstarter and is now shipping to backers.
> 在户外运动中,湿漉漉的袜子或潮湿的装备带来的不适感可能令人不快,但旅行装的 Hedgehog Go 吹风机却能帮您解决这一难题。它可用于吹干靴子、装备和头发。这款 12.3 盎司(约 377 克)的吹风机配有可调节的热量设置,通过 105,000 转/分的风扇以超过 60 英里/小时(约 96 公里/小时)的速度吹出风力,并配有可更换的喷嘴。“我们使用的不同系统拥有 11 项专利,”Hedgehog 创始人 Bjorn Holte 说道。该设备由 Kickstarter 众筹,目前正在向支持者发货。
## Impact Acoustic Spark - 吸音灯
> Lighting impacts how rooms look and feel—and sound, if this pendant lamp is hanging around. Introduced this year by Swiss sound-management company Impact Acoustic, the Spark comes in five sizes and 36 colors, and delivers “exceptional sound absorption,” co-founder and CEO Sven Erni says. The lamp’s porous material absorbs ambient noise, reducing reverberations to create more acoustically-focused workspaces. What’s functional and chic is also sustainable: The Spark is made with felt the company crafts from up-cycled plastic bottles, and manufactured without adhesives for easy disassembly and full recyclability.
> 灯光会影响房间的外观和氛围,如果悬挂这款吊灯,声音效果也会受到影响。Spark 吊灯由瑞士音响管理公司 Impact Acoustic 于今年推出,共有五种尺寸和 36 种颜色,其联合创始人兼首席执行官 Sven Erni 表示,它拥有“卓越的吸音效果”。这款吊灯的多孔材质能够吸收环境噪音,减少混响,从而打造更注重声学效果的工作空间。它兼具实用性和时尚感,同时兼具可持续性:Spark 吊灯采用公司利用回收塑料瓶制作的毛毡制成,无需使用粘合剂,易于拆卸,可完全回收利用。
## Infinite Machine Olto - 一种在城镇中快速穿梭的方式
> In [the ](https://www.infinitemachine.com/olto?lp_location=wf)world of micro-mobility v[ehic](https://www.infinitemachine.com/olto?lp_location=wf)les, there’s now a dizzying array of mopeds, e-bikes, and scooters to choose from. The futuristic Olto combines features of all three in one slick design. Weighing 176 pounds (swappable battery included) and spacious enough for two passengers, it’s bike lane-legal and doesn’t require a license, registration, or insurance. Its 40-mile battery range can zip you to work as fast as 33 miles per hour. “To get people out of cars, you need alternatives,” says Infinite Machine co-founder Joseph Cohen. Olto aims to include several of the best.
> 在微型交通工具领域,如今有琳琅满目的轻便摩托车、电动自行车和踏板车可供选择。充满未来感的 Olto 将这三种车型的特点融入到一款时尚的设计中。它重 176 磅(含可更换电池),空间宽敞,可容纳两名乘客,可在自行车道上合法行驶,无需驾照、登记或保险。其 40 英里的电池续航里程可让您以每小时 33 英里的速度快速到达工作地点。“要让人们放弃汽车,你需要其他选择,”Infinite Machine 联合创始人 Joseph Cohen 说道。Olto 的目标是囊括其中的几款最佳车型。
## Moft Snap-on 手机支架和钱包 - 折纸 MagSafe 钱包
> Moft’s clever magsafe wallet has enough space for two credit cards—or a handful of bills—in the small vegan leather slab that attaches to the iPhone’s MagSafe connector, leaving your camera clear for quick snaps. The 6 mm thick origami-inspired design also unfolds into three separate angles to act as a stand for your phone on a flat surface. That’s ideal for taking selfies, watching YouTube, or scrolling through social media. It comes in 27 modern colors, including terracotta, lavender, and soft avocado. And at just over 2 oz., it’s a barely noticeable addition to your pocket.
> Moft 的这款 MagSafe 钱包设计精巧,小巧的人造皮革材质足以容纳两张信用卡或几张钞票,并可连接到 iPhone 的 MagSafe 接口,让你的相机保持清晰,方便快速拍照。这款 6 毫米厚的钱包采用折纸设计,可展开成三个不同的角度,可作为手机支架,放置在平面上。非常适合自拍、观看 YouTube 或浏览社交媒体。钱包提供 27 种时尚配色,包括赤土色、薰衣草色和软牛油果色。重量仅 2 盎司多一点,放在口袋里几乎不会显得突兀。
## NordicTrack Ultra 1 - 顶级跑步机
> The typical treadmill is all function and no form. The super-sleek NordicTrack Ultra 1 offers plenty of both. Released earlier this year for NordicTrack’s 50th anniversary, the machine features metal and hardwood uprights, brass control handles, dual vertical fans for full-body cooling, a control hub decoupled from the deck for vibration-free running, a 24-inch touchscreen that pivots to support non-treadmill workouts, and an eight-speaker surround sound system. Although the bestselling NordicTrack Commercial 1750 also has impressive features—and for a fraction of the price: $2,799 compared to $15,000—it can’t compete on style.
> 典型的跑步机只注重功能,不注重外形。超薄的 NordicTrack Ultra 1 兼具了两者。这款跑步机于今年早些时候为庆祝 NordicTrack 成立 50 周年而推出,采用金属和硬木立柱、黄铜控制手柄、用于全身冷却的双垂直风扇、与跑板分离的控制中心(可实现无振动跑步)、可旋转以支持非跑步机锻炼的 24 英寸触摸屏以及八扬声器环绕音响系统。虽然畅销的 NordicTrack Commercial 1750 也拥有令人印象深刻的功能(而且价格仅为其一小部分:2,799 美元,而 NordicTrack 1750 的价格为 15,000 美元),但它在外观设计上却无法与 NordicTrack 1750 相媲美。
## **Quip Ultra** - 智能电动牙刷
> Replacing electric toothbrush heads usually means substituting the neck up. That’s “like changing half your car when you need it serviced,” says Tom Johnstone, CMO at Quip. The Quip Ultra is a sonic electric toothbrush with replaceable brush “pods.” Not much bigger than the bristles, these heads reduce toothbrush waste by 70%, Quip says. A haptic strip on the handle lets users adjust power and set timers as easily as scrolling on a classic iPod, the wireless charging dock and magnetic mirror mount are elegant bathroom decor, and a connected app tracks your brushing habits with feedback for cleaner teeth.
> 更换电动牙刷刷头通常意味着更换刷颈。Quip 首席营销官汤姆·约翰斯通 (Tom Johnstone) 表示,这“就像在需要保养时更换半辆汽车一样”。Quip Ultra 是一款声波电动牙刷,配有可更换的刷头“胶囊”。Quip 表示,这些刷头比刷毛大不了多少,可以减少 70% 的牙刷浪费。手柄上的触觉条让用户可以像在经典 iPod 上滚动一样轻松地调节功率和设置定时器;无线充电底座和磁性镜架是浴室的优雅装饰;连接的应用程序可以跟踪您的刷牙习惯并提供反馈,帮助您清洁牙齿。
## Samsung The Frame Pro - 完美融合的无线电视
> Building on its predecessor’s success, Samsung’s The Frame Pro, released in April, tries to make technology less intrusive in your home. It mounts with a customizable fra[me to mi](https://www.samsung.com/us/lifestyle-tvs/the-frame/85-inch-class-the-frame-pro-neo-qled-4k-tv-ls03fw-sku-qn85ls03fwfxza/)mic a gallery wall, blending in with framed photographs and artwork, and can display art from museum collections when asleep. It also has 4K resolution, a speedy 120 Hz refresh rate, and a slew of other tools that make it competitive with other smart TVs. But a sleek-looking television is no good if unsightly cables trail from its frame. The Wireless One Connect Box can sit up to 30 feet away and beam signals to the TV, no strings attached—literally.
> 继上一代产品的成功之后,三星于今年四月发布的 The Frame Pro 电视,致力于降低科技产品对家居环境的干扰。它采用可定制的框架,模拟画廊墙面,与相框中的照片和艺术品完美融合,即使在睡眠状态下也能展示博物馆藏品。此外,它还拥有 4K 分辨率、120 Hz 的快速刷新率以及一系列其他功能 ,使其在与其他智能电视的竞争中脱颖而出。然而,如果电视机的框架上拖着难看的线缆,那么即使外观时尚,也无济于事。Wireless One Connect Box 可以放置在距离电视机 30 英尺(约 9 米)远的地方,并将信号传输到电视机,完全免费——真的。
## Speedo Sunny G Mariner Mirrored - 时尚的游泳镜
> Who said swim goggles have to look, and feel, like swim goggles? Eschewing utilitarian design, Speedo’s Sunny G Mariner Mirror Goggles both resemble and act like aviator sunglasses. Users say the UV protection encourages them to keep the goggles on their face even out of the water, but they suction well in the pool, landing closer to the cheekbones than eye sockets for increased comfort. Instead of the usual rubber strap that pulls on hair, the Sunny G uses a gentler, adjustable bungee cord. Based on the brand’s popular kids’ goggles, the often sold-out Sunny Gs offer anti-fog lenses in red, blue, and green.
> 谁说泳镜必须看起来、摸起来像泳镜?Speedo 的 Sunny G Mariner Mirror 泳镜摒弃了功利主义的设计,外观和使用体验都与飞行员太阳镜相似。用户表示,其防紫外线功能让他们即使出水也能将泳镜固定在脸上,而且在泳池中吸力出色,更贴近颧骨而非眼窝,从而提升佩戴舒适度。Sunny G 摒弃了常见的会拉扯头发的橡胶带,而是采用了更柔和、可调节的弹力绳。这款经常售罄的 Sunny G 系列泳镜以该品牌备受欢迎的儿童泳镜为基础,提供红、蓝、绿三色防雾镜片。
## Squarespace Blueprint AI - 人工智能引导的网站构建器
> Consumer-friendly web design relies on templates, making every website look the same. Blueprint AI, Squarespace’s AI-guided builder, asks a handful of questions and instantly spins up unique web designs, including imagery curated by the company’s own designers, so users can tweak pages rather than start from scratch. “Great design is inherently human,” says chief product officer Paul Gubbay. “We wanted to make sure the user felt AI was enhancing their story, but wasn’t taking over for them.” More than half of new customers now begin with Blueprint, while a late-September update added in a chat element to make sites even more personally tailored.
> 消费者友好的网页设计依赖于模板,这使得每个网站看起来都千篇一律。Squarespace 的人工智能引导式构建器 Blueprint AI 只需提出几个问题,即可立即生成独特的网页设计,包括由公司内部设计师精心挑选的图像,因此用户可以调整页面,而无需从头开始。首席产品官 Paul Gubbay 表示:“伟大的设计本质上是人性化的。我们希望确保用户感受到人工智能在增强他们的故事,而不是取代他们。”现在,超过一半的新客户都开始使用 Blueprint,而 9 月下旬的更新添加了聊天元素,使网站更加个性化。
## **Telepathic Instru**ments Orchid ORC-300 - 来自 Tame Impala 的紧凑型合成器
> Tame Impala’s Kevin Parker took making music one step [further and ma](https://us.telepathicinstruments.com/products/orchid-orc-1000)d[e a new instru](https://us.telepathicinstruments.com/products/orchid-orc-1000)ment. Parker’s brainchild, the Orchid ORC-300, is a compact synthesizer with a single octave of keys that can fit in a backpack and lets players create complex chords with minimal musical expertise or technical dexterity. Why chords specifically? “Every song’s got to have chords,” Parker says, “They're the part that slows me down when I'm writing.” Although there are plenty of tools to make songs sound polished, Parker says “there aren’t many things to help with the actual genesis of the song.” The first 4,000 Orchids—released in two drops—sold out in hours.
> Tame Impala 的 Kevin Parker 将音乐制作更进一步,制作了一种新乐器。Parker 的创意 Orchid ORC-300 是一款紧凑型合成器,只有一个八度的按键,可以放入背包,让玩家即使没有太多音乐专业知识或技术灵活性也能创作出复杂的和弦。为什么特别提到和弦?“每首歌都必须有和弦,”Parker 说,“它们是让我在创作时放慢速度的部分。”尽管有很多工具可以让歌曲听起来更精致,但 Parker 表示“没有多少东西可以帮助歌曲的实际创作。”首批 4,000 台 Orchid 分两次发售,几个小时内就销售一空。
## Waiting for Ideas PP-1 - 时尚的黑胶唱机
> Co[nven](https://www.waiting-for-ideas.com/projects/pp-1-by-waiting-for-ideas)[ti](https://www.waiting-for-ideas.com/projects/pp-1-by-waiting-for-ideas)onal record players still rely on delicate tonearms that intimidate casual listeners. PP-1, a sculptural aluminum deck from Paris creative studio Waiting For Ideas, flips things—literally. Place a record upside-down on the device, and a retractable needle extends itself, with internal sensors to set the tempo at 33 or 45 rpm. “I couldn’t find a turntable I liked,” designer Jean-Baptiste Anotin says, “so I built one that’s as simple as pressing play on Spotify.” The plug-and-play table weighs about 20 lbs. and began shipping in March. A sleeker PP-2 and matching passive speakers are already on the drawing board, Anotin says.
> 传统唱片机仍然依赖于精密的唱臂,这让普通听众望而却步。PP -1 是一款由巴黎创意工作室 Waiting For Ideas 打造的雕塑铝制唱机,它可谓是颠覆了传统。将唱片倒置放置在设备上,可伸缩唱针就会自动伸出,并配有内置传感器,可将速度设置为 33 或 45 rpm。“我找不到喜欢的唱机,”设计师 Jean-Baptiste Anotin 说,“所以我做了一个,操作起来很简单,只需在 Spotify 上按一下播放键即可。”这款即插即用的唱机重约 20 磅,已于三月份开始发货。Anotin 表示,更时尚的 PP-2 和配套的无源扬声器已经在设计中。
## Yukai Engineering Nekojita FuFu - 一只可爱的猫来冷却你的汤
> This rechargeable cat robot solves an occasiona[l inconvenien](https://globalstore.ux-xu.com/products/nekojita-fufu)ce in a very adorabl[e wa](https://globalstore.ux-xu.com/products/nekojita-fufu)y. Nékojita FuFu blows air to quickly cool off steaming bowls and mugs while perching on their rims. Nékojita—which is Japanese for “cat tongue” and a reference to temperature-sensitive palates—can be set to a constant blow or random intervals, bringing a steaming hot mug to a drinkable temperature in just three minutes. CEO Shunsuke Aoki says the device is designed for parents with young children to reduce “the burden of constantly blowing on food.” Nékojita FuFu has shipped to over 5,000 customers worldwide.
> 这款可充电猫咪机器人以一种非常可爱的方式解决了偶尔出现的不便。Nékojita FuFu 会停在碗和杯子的边缘,吹气快速冷却冒着热气的碗和杯子。Nékojita(日语中意为“猫舌头”,指对温度敏感的味蕾)可以设置为持续吹气或随机间隔,只需三分钟即可将热气腾腾的杯子加热到可饮用的温度。首席执行官 Shunsuke Aoki 表示,这款设备专为有幼儿的父母设计,旨在减轻“不断吹食物的负担”。Nékojita FuFu 已向全球超过 5,000 名客户发货。
# **Education 教育**
## Edthena AI Coach - 教师助手
> Classroom teachers need to learn, too, but often don’t get adeq[uate ins](https://www.edthena.com/ai-coach-for-teachers/)tructional coaching. Ed[tech com](https://www.edthena.com/ai-coach-for-teachers/)pany Edthena created AI Coach, the latest version of which debuted with elementary school math teachers in September. They can record and upload their lessons, and then the platform—validated by researchers at the University of Virginia—analyzes audio and video and offers time-stamped feedback detailing opportunities for improvement. The goal, says Edthena CEO Adam Geller, is to “give teachers clarity on how to grow, the confidence to try new strategies, and the support to keep improving.” The research that informed the program was backed by the Gates Foundation.
> 课堂教师也需要学习,但往往得不到足够的教学指导。教育科技公司 Edthena 创建了 AI Coach ,其最新版本于 9 月在小学数学教师中首次亮相。教师可以录制并上传课程,然后该平台(经弗吉尼亚大学研究人员验证)会分析音频和视频,并提供带有时间戳的反馈,详细说明改进机会。Edthena 首席执行官亚当·盖勒表示,其目标是“让教师明确如何成长,有信心尝试新策略,并获得持续改进的支持”。该项目的研究得到了盖茨基金会的支持。
## Roli Piano System - 学习弹奏
> A piano may seem out of reach for a lot of people. It’s huge, expensive, and the learning process requires years of investment. The Roli Piano system aims to make it more accessible. The colorful, light-up keyboard is educational and engaging; a stand-mounted camera watches learners’ fingers and gives personalized feedback like a live teacher would, and the accompanying app is full of popular music. “We asked: What if the piano itself could guide you, interact with you, and grow with you over time?” says Roli senior commercial director Luke Barton. “What if learning an instrument could feel more like play than practice?”
> 对很多人来说,钢琴似乎遥不可及。它体积庞大、价格昂贵,学习过程需要多年的投入。Roli 钢琴系统旨在让钢琴更容易普及。色彩鲜艳、会发光的键盘既有教育意义又引人入胜;支架式摄像头可以观察学习者的手指,并像现场老师一样提供个性化反馈;配套的应用程序则充满了流行音乐。“我们问自己:如果钢琴本身可以引导你、与你互动,并随着时间的推移与你一起成长,那会怎样?” Roli 高级商务总监 Luke Barton 说道。“如果学习乐器的感觉更像是演奏而不是练习,那会怎样?”
## Squirrel Ai 智能自适应学习系统 - 个性化人工智能课程计划
> Squirrel Ai’s platform is based on what it calls a “large adaptive model,” a combination of education-specific AI systems, trained and ev[aluat](https://www.technologyreview.com/2019/08/02/131198/china-squirrel-has-started-a-grand-experiment-in-ai-education-it-could-reshape-how-the/)ed by human [educat](https://www.bloomberg.com/news/features/2025-09-18/ai-in-schools-a-chinese-entrepreneur-is-betting-on-algorithms-as-teachers)or[s and stu](https://learningpolicyinstitute.org/blog/addressing-teacher-shortages-insights-four-states)dents in Pre-K through 12th grade. The company has been educating more than 24 million students in China with its AI tutoring—in some cases fully supplanting in-person lessons—and is now expanding into the U.S. Unlike other AI learning tools that partner with schools, Squirrel operates its own learning centers that use AI to personalize each student’s lesson plan and testing. The company’s expansion may be buoyed, in part, by a severe shortage of teachers: In the U.S.; an estimated 400,000 open teaching positions went unfilled last year. “Our LAM engine acts as a really good teacher, someone who’s been a teacher for 20 or 30 years,” claims Joleen Liang, president of Squirrel’s U.S. division.
> 松鼠 AI 的平台基于所谓的“大型自适应模型”,即由人类教育工作者和从幼儿园到 12 年级的学生训练和评估的教育专用人工智能系统的组合。该公司一直通过其人工智能辅导教育中国超过 2400 万名学生 - 在某些情况下完全取代了面对面授课 - 目前正在向美国扩张 。与其他与学校合作的人工智能学习工具不同,松鼠 AI 运营着自己的学习中心,使用人工智能为每个学生制定个性化的课程计划和测试。该公司的扩张可能部分受到教师严重短缺的推动:在美国,去年估计有 40 万个开放的教学职位空缺。松鼠 AI 美国分部总裁 Joleen Liang 声称:“我们的 LAM 引擎就像一位非常优秀的老师,一位已经当了 20 或 30 年老师的人。”
## **Superfluent** - 对话式语言学习应用
> When [Superfluent](https://www.superfluent.com/)[ founder Sa](https://www.superfluent.com/)m Nevada moved to Denmark, he found learning conversational Danish from apps—most of which are vocabulary-based—frustrating. “I could say, ‘The bear is having ice cream in a red car,’ but I couldn’t actually do much more than that,” he says. When large language models like ChatGPT arrived, Nevada saw an opportunity to create something more useful for daily life. Superfluent, built on a combination of OpenAI’s and Google’s models, uses conversational AI to assess users’ fluency and create appropriate dialogue scenarios, like ordering a coffee in a cafe, or inviting a friend to a party. Each lesson takes around five minutes.
> Superfluent 创始人 Sam Nevada 移居丹麦后,发现用大多数基于词汇的应用程序学习丹麦语会话令人沮丧。“我能说,‘熊在一辆红色汽车里吃冰淇淋’,但实际上我只能做到这些,”他说。当像 ChatGPT 这样的大型语言模型出现时,Nevada 看到了创造更贴近日常生活的语言的机会。Superfluent 结合了 OpenAI 和谷歌的模型,利用会话式人工智能评估用户的流利程度,并创建合适的对话场景,例如在咖啡馆点咖啡,或邀请朋友参加派对。每节课大约需要五分钟。
## Turnitin Clarity - 课堂人工智能护栏
> As [concern](https://www.turnitin.com/products/feedback-studio/clarity)s[ ab](https://www.turnitin.com/products/feedback-studio/clarity)out AI-fueled cheating mount, Turnitin is trying to use the technology to support writing students and educators. Clarity, software now being piloted by scores of high schools and universities, features a digital platform where students draft assignments, and—when teachers permit—access approved AI tools that provide feedback rather than answers. Educators can review version histories to see how submitted assignments were created, to detect AI use and whether anything was plagiarized. “The teacher has control over how much AI the student can use," says Chief Product Officer Annie Chechitelli.
> 随着人们对人工智能引发作弊行为的担忧日益加剧,Turnitin 正尝试利用这项技术为写作学生和教育工作者提供支持 。Clarity 软件目前正在数十所高中和大学试用,它提供了一个数字平台,学生可以在平台上起草作业,并在教师允许的情况下使用经批准的人工智能工具,这些工具提供反馈而非答案。教育工作者可以查看版本历史记录,了解已提交作业的创建过程,检测人工智能的使用情况以及是否存在抄袭行为。首席产品官 Annie Chechitelli 表示:“教师可以控制学生使用人工智能的程度。”
# Entertainment & Gaming 娱乐
## Epson Lifestudio Flex Plus - 随时随地享受强大的流媒体
> Epson’s Flex Plus isn’t your dad’s slide projector. Launched in September, the smart streaming projector—part of the company’s new Lifestudio range—sets up in seconds, can be easily moved from room to room, and pivots 90-degrees to project onto the ceiling, yet delivers “big, bright, and beautiful” 4K PRO-UHD picture quality to nearly any flat surface, says Epson product manager Kenny Tang. The line features a Bose audio system—the first time the company has integrated its audio into a smart streaming projector—while the Epson Projection Studio companion app lets multiple people project photos and videos in real time. And the option of a soft downward glow turns the projector into a sidetable lamp.
> 爱普生的 Flex Plus 可不是你老爸的幻灯机。这款智能流媒体投影仪于今年 9 月推出,是公司全新 Lifestudio 系列的一部分。爱普生产品经理 Kenny Tang 表示,它只需几秒钟即可安装完毕,可以轻松地在各个房间之间移动,并可旋转 90 度投射到天花板上,同时还能在几乎任何平面上呈现“大尺寸、明亮、精美”的 4K PRO-UHD 画质。该系列产品配备 Bose 音响系统——这是该公司首次将音频系统集成到智能流媒体投影仪中——而配套的 Epson Projection Studio 应用程序可让多人实时投影照片和视频。此外,柔和的向下发光选项可将投影仪变成一盏边台灯。
## **Falcon's Flight** - 世界上最大的过山车
> The world’s tallest, fastest, and longest roller coaster is almost ready for launch. Falcon’s Flight is two miles long, over 600 ft. tall, and—with a 519-ft[. drop—](https://qiddiya.com/qiddiya-city/sixflags/)hits a top speed of 155 mph. It’s just one of 28 rides coming to Six Flags Qiddiya City outside of Riyadh, Saudi Arabia. Falcon's Flight is so massive it can be seen from space and so fast that unique curved windshields were designed to protect riders from wind and desert sand. Six Flags Qiddiya City, the first Six Flags location outside North America, is expected to open by late 2025.
> 全球最高、最快、最长的过山车即将投入运营。“猎鹰飞行”长两英里,高超过 600 英尺(约 180 米),落差 519 英尺(约 156 米),最高时速可达 155 英里(约 249 公里)。它只是沙特阿拉伯利雅得郊外六旗奇迪亚城 28 座游乐设施之一。“猎鹰飞行”体型巨大,从太空都能看到;速度极快,其独特的弧形挡风玻璃设计能够有效保护乘客免受风沙侵袭。六旗奇迪亚城是六旗集团在北美以外的首家游乐设施,预计将于 2025 年底开业。
## Nintendo Switch 2 - 轰动一时的游戏机
> The original Nintendo Switch rewrote the rules for portable gaming. Its 2025 sequel increases the power without sacrificing portabi[lity. A sa](https://www.wsj.com/business/switch-2s-record-sales-make-it-nintendos-fastest-selling-console-b8d32b46)mpling of its impressive stats: An Nvidia Tegra T239 chip, alongside dedicated ray-tracing and Deep Learning Super-Sampling (DLSS) cores, lets the new model run at 4K on TVs, while the on-device 7.9-inch HDR display runs handheld titles at 1080p and 120Hz, meaning there’s no flicker during gameplay. Its 12 GB of LPDDR5X memory also helps keep sprawling open worlds stutter-free. Launched in June, the console sold 3.5 million units in its first week—making it Nintendo’s fastest-selling hardware ever.
> 初代任天堂 Switch 改写了掌上游戏的规则。其 2025 年的续作在提升性能的同时,依然保留了便携性。以下是一些令人印象深刻的数据:Nvidia Tegra T239 芯片,以及专用的光线追踪和深度学习超级采样 (DLSS) 核心,使新款 Switch 在电视上能够以 4K 分辨率运行;而设备内置的 7.9 英寸 HDR 显示屏则能够以 1080p 和 120Hz 的刷新率运行掌上游戏,这意味着游戏过程中不会出现闪烁。其 12 GB 的 LPDDR5X 内存也有助于在广阔的开放世界中保持流畅的画面。这款游戏机于今年 6 月上市,首周销量达 350 万台,成为任天堂有史以来销售最快的硬件产品 。
## Samsung Premiere 5 - 4K 触摸屏投影仪
> Samsung’s Premiere 5 can be used for much more than movie night. The short-throw projector beams a crisp, up-to-100-inch 4K image from as close as just 43cm away thanks to its triple laser tech, but it can also become a 40-inch interactive touchscreen—which its makers say could be handy for projecting recipes, homework, or yoga onto walls or floors. And its built-in 10W speakers are powerful enough for a cinema-like soundscape during multi-player gaming. “The Premiere 5 delivers an unprecedented, fully-featured entertainment experience,” says Kevin Lee, Samsung Electronics’ executive vice president of customer experience for visual displays.
> 三星 Premiere 5 的用途远不止电影之夜。这款短焦投影仪采用三重激光技术,可在近至 43 厘米的距离投射出高达 100 英寸的清晰 4K 图像,同时还能变身为 40 英寸的交互式触摸屏——其制造商表示,这可以方便地将食谱、家庭作业或瑜伽练习投影到墙壁或地板上。其内置的 10W 扬声器足以在多人游戏中营造出影院般的音效。“Premiere 5 带来了前所未有的、功能齐全的娱乐体验,”三星电子视觉显示客户体验执行副总裁 Kevin Lee 表示。
## Soundcore Rave 3S - 按需卡拉 OK
> Soundcore’s Rave 3S AI party speaker transforms any tune into a karaoke backing track. Launched in March, the Rave 3S distinguishes itself with its AI Vocal Removal technology, which allows for lowering or nixing vocals so partygoers can belt their song of choice—from Spotify, YouTube, TikTok, and more—on demand. It also includes two wireless mics, a guitar input, a 6.5-inch woofer, three 2.5-inch full-range speakers, and eight light effects that sync with the beat, while Soundcore’s app offers four vocal enhancements. And if you forget the lyrics, it brings the song’s vocals up to 50% until you’re back on track.
> Soundcore 的 Rave 3S AI 派对音箱可将任何曲调转换为卡拉 OK 伴奏。Rave 3S 于三月上市,其独特之处在于其 AI 人声消除技术,该技术可以降低或消除人声,让派对参与者可以根据需要高声演唱他们喜欢的歌曲——从 Spotify、YouTube、TikTok 等平台获取。它还配备两个无线麦克风、一个吉他输入接口、一个 6.5 英寸低音扬声器、三个 2.5 英寸全频扬声器以及八种与节拍同步的灯光效果,而 Soundcore 的应用程序则提供四种人声增强功能。如果您忘记了歌词,它会将歌曲的人声音量提升至 50%,直到您重新回到正轨。
## **ROG Xbox Ally X** - 便携式游戏 PC
> Gaming habits have become more portable, and the ROG Xbox Ally X is ASUS and Microsoft’s response to the trend. The two companies partnered to build a powerful handheld that’s designed to meet players across platforms. “It would have been easy mode for us to make another walled garden,” says Jason Beaumont, vice president of Xbox experiences at Microsoft. “But [players] wanted to be able to play their games regardless of where they came from.” Launching in October, the handheld can play compatible games from across a user’s PC or Xbox library. And because the device runs Windows 11, it can play PC games from third-party storefronts, too.
> 如今,游戏习惯变得更加便携,ROG Xbox Ally X 正是华硕和微软顺应这一趋势的成果。两家公司携手打造了一款功能强大的掌上游戏机,旨在满足跨平台玩家的需求。“对我们来说,再建一个‘围墙花园’很容易,”微软 Xbox 体验副总裁 Jason Beaumont 表示,“但玩家希望无论来自哪里都能畅玩游戏。”这款掌上游戏机将于 10 月上市,可以运行用户 PC 或 Xbox 游戏库中的兼容游戏。此外,由于该设备运行 Windows 11 系统,因此还可以运行来自第三方商店的 PC 游戏。
# Experimental 实验性
## AirCo AirMade SAF - 无化石燃料的航班
> The name says it all: AirCo pulls carbon di[oxide a](https://www.aircompany.com/sustainable-aviation-fuel/)[nd hydr](https://www.aircompany.com/sustainable-aviation-fuel/)ogen from the air to make AirMade fuel, turning atmospheric gasses into flight-ready energy. The jet fuel meets all existing aviation specifications without fossil fuels. In April, the U.S. Air Force successfully powered a flight using only the CO₂-derived jet fuel. The test “proved this isn’t just lab science,” says Gregory Constantine, AirCo co-founder and CEO. “It is real, mission-ready fuel.” The company now has over 1 billion gallons in commercial airline commitments and $69 million in fresh funding.
> 顾名思义:AirCo 从空气中提取二氧化碳和氢气,制造出 AirMade 燃料,将大气中的气体转化为飞行所需的能源。这种航空燃料符合所有现行航空规范,无需使用化石燃料。今年 4 月,美国空军成功完成了一次仅使用这种二氧化碳衍生航空燃料的飞行。AirCo 联合创始人兼首席执行官 Gregory Constantine 表示,这项测试“证明这不仅仅是实验室科学,而是真正的、随时可执行任务的燃料”。目前,该公司已获得超过 10 亿加仑的商业航空公司订单,并获得了 6900 万美元的新融资。
## Atropos Health ChatRWD - 随叫随到的临床查询
> While general artificial intelligence tools are dubious at dispensing medical advice, Atropos Health's ChatRWD offers clinicians AI that doesn’t encroach on their Hippocratic Oath. Drawing from a database of 300 million anonymized patient records, ChatRWD lets doctors simulate custom clinical trials in seconds, and claims reliable answers 94% of the time versus less than 10% for general AI models. Just one example of its real world impact: When anesthesiologists debated whether patients should stop diabetes medications before surgery, a Mills-Peninsula Medical Center study using ChatRWD analyzed 13,000 diabetes patients and found no increased surgical risk, helping avoid unnecessary medication interruptions and rescheduled procedures.
> 虽然一般的人工智能工具在提供医疗建议方面存在争议,但 Atropos Health 的 ChatRWD 为临床医生提供了不违背希波克拉底誓言的人工智能。ChatRWD 拥有 3 亿份匿名患者记录数据库,可让医生在几秒钟内模拟定制临床试验,并能提供 94% 的可靠答案,而一般人工智能模型的准确率不到 10%。以下是其现实世界影响的一个例子:当麻醉师争论患者是否应该在手术前停用糖尿病药物时,米尔斯半岛医疗中心的一项研究使用 ChatRWD 分析了 13,000 名糖尿病患者,发现手术风险并未增加,有助于避免不必要的药物中断和手术重新安排。
## **Northwestern University **Millimeter Pacemaker - 婴儿的微型心脏助手
> A wire[less, dis](https://news.northwestern.edu/stories/2025/03/worlds-smallest-pacemaker-is-activated-by-light)so[lvab](https://rogersgroup.northwestern.edu/)[le ](https://news.northwestern.edu/stories/2025/03/worlds-smallest-pacemaker-is-activated-by-light)pacemaker could revolutionize treatment for the more than one in 15,000 babies born with congenital heart defects each year. Existing, wired pacemakers risk tissue scarring and other dangers. Professor John Rogers and a team of researchers at Northwestern University developed a pacemaker smaller than a grain of rice that, when injected with a syringe, binds to the heart using absorbable polymers and regulates heartbeat by receiving light signals from a sensor on the skin’s surface. It can be built to dissolve after a certain number of days. “It’s blurring the distinction between a traditional implant and a pharmaceutical,” Rogers says.
> 一种无线可溶解起搏器可能会彻底改变每年每 15,000 名新生儿中就有一名患有先天性心脏缺陷的婴儿的治疗方式。现有的有线起搏器存在组织瘢痕形成和其他风险。西北大学的约翰·罗杰斯教授及其研究团队研发了一种比米粒还小的起搏器,用注射器注射后,它利用可吸收聚合物与心脏结合,并通过接收皮肤表面传感器的光信号来调节心跳。它可以在一定天数后溶解。“它模糊了传统植入物和药物之间的界限,”罗杰斯说。
## **Boston Universit**y Wireless MRI Coils - 可穿戴成像
> MRI scans may soon l[eave costly, b](http://bu.edu/articles/2024/making-mri-more-globally-accessible/)ulky hospital machines behind. Boston University researchers have built bendable wireless coil sensors that attach to the body, weigh less than an AA battery, and cost only $50. The eureka moment was the discovery that "a simple segment of coaxial cable—the same type that brings internet into your home—could deliver outstanding MRI performance," says Professor Xin Zhang, who leads the team developing the wireless technology. That insight could one day allow "first responders using portable MRI to assess injuries on the spot, a scenario unthinkable just a decade ago," she says.
> MRI 扫描可能很快就会取代昂贵笨重的医院机器。波士顿大学的研究人员研制出了一种可弯曲的无线线圈传感器 ,它可以贴在身上,重量比一节 AA 电池还轻,成本仅为 50 美元。这项无线技术研发团队负责人张欣教授表示,他们发现“一段简单的同轴电缆——与将互联网带入家庭的电缆相同——就能提供出色的 MRI 性能”。她表示,这一发现未来可能有一天能让“急救人员使用便携式 MRI 现场评估伤情,而这在十年前是不可想象的”。
## **Carbios Enzymes** - 回收纺织废料
> For Carbios, a French biotech firm, one man's trash is another man's classic white T-shirt. Working with cl[othing man](https://www.k-online.com/en/media_news/k-mag/sustainability/circular-economy/enzyme-recycling-textile-carbios)ufacturers like Patagonia, Puma, and Salomon, the company developed recycling technology that uses enzymes to break down polyester fibers in t[ex](https://www.k-online.com/en/media_news/k-mag/sustainability/circular-economy/enzyme-recycling-textile-carbios)t[ile wa](https://www.waste360.com/waste-recycling/carbios-figures-out-polyester-fiber-to-fiber-recycling)ste; the enzymes act like microscopic scissors on the polyester, leaving behind raw material that can be reconstituted, spun into yarn, and woven into fabric for new garments. The company’s first commercial plant, scheduled to open in France in 2026, will process tens of thousands of tons of waste per year to manufacture fresh plastic packaging and textiles—including about 400 million T-shirts.
> 对于法国生物科技公司 Carbios 来说,一个人眼中的垃圾,对另一个人来说却是经典的白色 T 恤。该公司与巴塔哥尼亚、彪马和萨洛蒙等服装制造商合作,开发了利用酶分解纺织废料中聚酯纤维的回收技术;酶就像微型剪刀一样作用于聚酯纤维,留下可重组、纺成纱线、织成新服装面料的原材料。该公司首家商业工厂计划于 2026 年在法国投产,每年将处理数万吨废料,用于生产新的塑料包装和纺织品——其中包括约 4 亿件 T 恤。
## Cognixion Axon-R - 为无声者发声
> This noninvas[ive headset gi](https://clinicaltrials.gov/study/NCT06810219)ves v[oice ](https://clinicaltrials.gov/study/NCT06810219)to people who have lost theirs to traumatic brain injury, stroke, ALS, or other neurological conditions. Axon-R measures eye, head, and brain activity to let individuals select letters, words, or commands, and also builds a personalized assistive AI model that suggests response words and phrases to users. The headset’s speaker generates speech in their voice. “It gives them their life back,” says founder and CEO Andreas Forsland. In March, Cognixion announced a clinical trial with late-stage ALS patients. Axon-R, which leading brain-computer interface company Blackrock Neurotech began distributing this year, is now being used by over a dozen major health systems.
> 这款非侵入式耳机让因创伤性脑损伤、中风、肌萎缩侧索硬化症 (ALS) 或其他神经系统疾病而失去声音的人们重获新生。Axon-R 可以测量眼部、头部和大脑活动,帮助用户选择字母、单词或命令,并构建个性化的辅助人工智能模型,为用户推荐相应的单词和短语。耳机的扬声器可以生成用户的声音。“它让他们重获新生,”创始人兼首席执行官 Andreas Forsland 说道。今年 3 月,Cognixion 宣布将对晚期 ALS 患者进行临床试验 。领先的脑机接口公司 Blackrock Neurotech 于今年开始分销 Axon-R,目前已有十多个大型医疗系统在使用。
## Flocean Subsea Desalination Plant - 高效制造淡水