一文看AI最新进展！民工使用指南

日期：2023-10-17 13:48:42 / 人气：320

2023年3月，以GPT-4为代表的AI技术掀起了一波AI热。半年过去了，AI领域有了很多新的发展，有些可能会彻底改变农民工的生活。
下面，我们就来盘点一下这半年来AI领域最值得你关注的事情。
GPT最大的竞争对手双子座出现了。
2023年5月，在谷歌I/O开发者大会上，谷歌CEO皮查伊透露，谷歌的深层思维正在训练双子座模型。
Gemini是一个大型语言模型，专门用于测试GPT-4。根据半分析的分析，双子星的计算能力将达到GPT-4的五倍。
此外，与GPT-4相比，Genimi可以更好地支持多模态输入，这意味着除了文本信息，双子座还可以处理图片和语音信息，这可能使双子座比现在的GPT-4更方便使用。
而且我们可能很快就能见证双子座的表现了。据海外科技媒体The Information 9月14日报道，双子星已经向部分公司开放了使用和测试的权限。也许用不了多久，Gemini就会被部署到谷歌的产品矩阵中，开始服务大众。
来源:网络
开放式人工智能培训
更通用的“GPT-5”
当然，面对双子星这样拥有多模态能力的对手，OpenAI也不会坐以待毙。
事实上，早在今年3月的GPT-4会议上，GPT-4就展示了其多模态处理能力。在当时的发布会上，主讲人手绘了一个网页的草图，拍了照片发给GPT 4号，告诉它按照这个布局做一个网页，GPT 4号马上就写出了网页代码。
但在发布会后的实际应用中，用户似乎并没有体验到ChatGPT的多模态处理能力。
为了迎接谷歌双子星座的挑战，OpenAI将ChatGPT与Dall e-3(一种新的图像生成模型)相结合，使GPT更加通用。9月25日，GPT-4版本更新后，也可以处理语音和图片信息。
比如下面是Dall e-3和ChatGPT生成的内容。GPT不仅能根据文字画出相应的图片，还能解释图片上的信息，并根据对话对图片进行一些修改。
根据文本创建的图片
GPT解释了为什么图片中的刺猬这么好。
根据要求，“秀刺猬很热情”，DALL E 3生成的图片。
除了将Dall e-3与ChatGPT结合，OpenAI还开始部署“GPT-5”。在9月25日发布的新版GPT中，已经引入了语音通信和图像识别的测试功能。
事实上，今年3月(也就是GPT-4出现后不久)，网上就出现了一波要求暂停GPT-5研究的浪潮，原因是担心信息安全和隐私问题。作为OpenAI的首席执行官，山姆·奥特曼也承诺短期内不会训练GPT-5模型。
资料显示，GPT-4出现半年后，OpenAI已经开始研发代号为“戈壁”的新型号，在设计之初就具备多模态能力。甚至有些媒体声称它可能是未来的GPT-5。
微软发布“农民工福利套餐”
微软Copilot
9月21日，微软发布微软Copilot family bucket。如果你对微软Copilot不熟悉，可以理解为我们常用的Word、Excel、PPT等软件以及Windows自带的浏览器都会受到GPT-4的加持。
以我们最常用的词为例。写稿子的时候，可以直接告诉Word一个主题，让它自动生成与这个主题相关的稿子。同时它还具有图片匹配的功能，你甚至不需要花时间在网上找图片，只需要让它根据文字生成图片。
还有Excel。在新的微软Copilot family bucket中，不需要记忆各种公式，也不需要用Excel编程。你只需要告诉Excel你的用途，它就会自动为你完成编写公式、代码、分析数据的工作。你只需要等着看结果。
此外，在浏览网页时，你甚至不必详细阅读网页的内容。浏览器可以直接帮你汇总当前页面的重要信息，节省你很多时间。
这可能是半年来对打人工人最“友好”的AI礼包了。
人工智能帮助人类理解气味。
在人类的视觉、听觉和嗅觉中，嗅觉可能比我们想象的要复杂得多。
对于视觉来说，我们看到的颜色可以和光的波长联系起来。对于听觉来说，声音与物体的振动频率有关。关于嗅觉，人类不仅有数百种嗅觉感受器，而且生活中常见的气味往往是由多种气味分子组成的，很难建立简单完善的数学模型。
今年8月发表在《科学》杂志上的一篇论文指出，科学家通过“图形神经网络”的AI技术识别了气味与成分之间的关系，并生成了气味图谱。根据这个图谱，我们可以用已知的化合物来配置想要的味道。
更重要的是，AI绘制的气味地图覆盖了50万种潜在的气味，这意味着在AI的帮助下，我们可能能够闻到我们以前从未想象过的气味。这可能会大大改变食品和香料行业的现状，让我们的生活更“有味道”。
人工智能气味识别的过程，图片来源:参考资料。
自动驾驶亲自告诉你。
你怎么开车？
9月14日，自动驾驶公司Wayve发布了开环自动驾驶评论员LINGO-1。我们可以简单理解为自动驾驶解释器。
自动驾驶为什么需要翻译？事实上，这是一项非常有趣和重要的研究。想象一下，当你在开车的时候，你所做的每一个选择和动作都必须有一定的依据。比如你觉得前面的车太慢了，旁边的车道空着很安全，所以你决定开到旁边的车道超车，或者你在路口减速，因为这里人多，所以你需要仔细观察周围的环境。
LINGO-1还可以用熟悉的自然语言解释自动驾驶汽车的每一步，还可以回应特定的人类问题。比如自动驾驶汽车停在路口的时候，你可以问它“你现在在观察什么？”；如果你身边有人在骑自行车，你也可以问自动驾驶汽车“你怎么判断你和这个骑自行车的人保持了安全距离？”
目前LINGO-1的回答准确率只有60%左右，但是LINGO-1的能力还在提高，这种研究意义重大。
可以提高人工智能的可解释性。在过去，自动驾驶汽车的很多决策对于人类来说都是一个黑匣子。我们不知道车为什么变道，也不知道在前面可以超车的情况下为什么选择不超车。在了解了AI如何决策之后，工程师也可以更好地设计自动驾驶算法，不断提高自动驾驶汽车的安全性。同时也能增加普通用户对自动驾驶的理解和信任，让人工智能的决策过程不再是黑箱。
AI在很多比赛中都超过了人类。
8月30日，发表在《自然》杂志上的一篇文章显示，在无人机竞速的第一人称视角下，AI已经超越了人类。
第一人称视角的无人机竞速和普通遥控飞机不同。飞行员需要从高速飞行的无人机角度观察环境，并对其进行操纵。对于AI来说，AI需要快速分析视频传感器返回的信息，做出优化飞行路径的决策。《自然》杂志的文章称，能够在这场比赛中击败人类冠军，是“移动机器人和机器智能领域的里程碑”。这一成果可能对未来的自动驾驶汽车和无人飞行器具有重要价值。
除了无人机领域，AI在验证码领域也有惊人表现。
验证码在生活中很常见。当你想进入一个账号，登录一个网页的时候，经常会看到各种各样的验证码，包括识别奇形怪状的字母和数字，拖动一个类似拼图游戏的滑块，或者抬头点击一个图片。这些验证码的目的是防止机器人恶意登录注册。
但2023年7月的一篇文章显示，AI可能比人类更擅长处理验证码。该实验邀请了1000多名人类测试人员使用120个主流网站上的验证码。
结果表明，人类解决验证码问题的准确率为50% ~ 80%。相比之下，AI求解验证码的准确率在85% ~ 100%，大部分在96%以上。除了准确率比人类高，AI解验证码的时间也比人类快0.5秒。
这意味着，随着AI技术的发展，人类用来防范AI的验证码的作用可能会越来越小，这对网络和信息安全是非常严峻的挑战。科学家需要开始设计新的验证码，可以在不困惑人类的情况下防止AI。
人脑模拟计划“失败”
虽然近年来人工智能技术突飞猛进，但人类在用AI模拟人脑方面还是遭遇了“滑铁卢”。
2013年，欧洲科学家启动了一项为期10年的“人脑计划”。科学家打算用10年时间，利用顶尖的计算机技术，模拟人脑中的数百亿个神经元及其突触，从而还原人脑的运行过程，揭开人脑的神秘面纱。
今年10月1日是这一项目的“兑现”时间，但科学家们已累计投入13亿欧元(约合100亿人民币)，但距离“模拟人脑”的目标仍有很大距离。科学家们远远低估了人脑的复杂性。可以说，这是人类试图构建“人工智能”的一次失败。
虽然人类在人脑项目中还没有成功建立一个“人工智能”，但这样的探索是很有意义的。在这个项目中，科学家们真正对人脑有了更深入的了解。例如，科学家绘制了更详细的人脑地图，并在前额叶皮层发现了几个以前未知的大脑区域。
此外，科学家建立了基因表达与大脑结构的关系，科学家可以从基因层面研究一些与大脑结构相关的疾病(如抑郁症)。一些数字大脑模型也已经在临床上用于帕金森病等疾病。
来源:摄影师:许摄
除了欧洲脑计划，中国、美国、日本、韩国、澳大利亚等国家也有自己的脑计划。只有对人脑的结构和智能的起源有了更深入的了解，才能更好地发展“人工智能”技术。
人工智能的发展极其迅速。在过去的半年里，GPT-4遇到了一个强大的对手，AI帮助人类构建了气味地图和更详细的大脑地图，自动驾驶汽车也有了“解释器”。
正是这种快速的技术发展使我们能够享受更安全和更方便的生活。他们的发展是生活中每天上演的科幻大片。

作者：高德娱乐

一文看AI最新进展！民工使用指南

新闻资讯 News

案例展示 Case

现在致电 8888910 OR 查看更多联系方式 →

现在致电 8888910 OR 查看更多联系方式 →