AI 日报

20230618 Meta推出新的生成式AI模型Voicebox,可执行音频编辑、采样、风格化等语音生成任务





🦉 AI新闻

🚀 Meta推出新的生成式AI模型Voicebox,可执行音频编辑、采样、风格化等语音生成任务

摘要:Meta继推出ImageBind之后,于今天再次推出了全新的生成式AI模型Voicebox。该模型帮助创作者执行音频编辑、采样和风格化等语音生成任务,即便是普通用户也能轻松上手。Meta在介绍Voicebox模型时表示,视障人士可以听到好友的回复信息、普通用户可以用自己的语调、语气来说外语。该模型的未来发展包括在元宇宙游戏中为视觉助理或非玩家角色提供自然的声音。

🚀 微软CEO纳德拉:善用生成式AI技术可以取得更多成就,GPT-4将跨越语言边界

摘要:微软首席执行官萨蒂亚・纳德拉接受采访时,谈到了微软的人工智能计划以及他对生成式AI的看法。他表示,在GPT-2.5升级到GPT-3之后,微软就意识到生成式AI带来的深远影响,并认为善用这项技术可以取得更多的成就。他还介绍了GPT-3模型帮助他实现童年梦想的故事。纳德拉在采访中表示:“GPT-4进一步完善,不仅仅是机器翻译,而是跨越两种语言边界保留了诗歌的韵味,这太酷了。”

🚀 华为轮值董事长胡厚崑:新的人工智能时代已到来,人工智能算力将增加500倍

摘要:2023年APEC工商领导人中国论坛上,华为轮值董事长胡厚崑表示,以ChatGPT为代表的新的人工智能时代已到来,预测人工智能算力将增加500倍。到2030年,全球总联接数将会达到2000亿,同时低时延应用将广泛普及,与此同时随着元宇宙、全息影像抵达,带宽需求将百倍增长。他还表示,数字技术已经成为推动人类社会进步的使能技术,在能源领域可以直接参与能源的低碳化进程,加快能源结构转型,数字技术可以赋能千行百业,实现提质增效、节能降碳。

🚀 中国科学院发布全模态大模型“紫东.太初”2.0

摘要:6月16日,中国科学院自动化研究所所长徐波在人工智能框架生态峰会2023上发布“紫东.太初”全模态大模型2.0版本。该模型在语音、图像和文本三模态的基础上加入了视频、信号、3D点云等模态数据,具备全模态理解、生成和关联能力。该模型已经在神经外科手术导航、短视频内容审核、法律咨询、医疗多模态鉴别诊断、交通违规图像研读等领域进行了一系列引领性、示范性应用。自动化所以“紫东.太初”为基础,持续探索通用人工智能并将探索在更多领域发挥赋能价值,为促进我国数字经济发展贡献力量。

🚀 东南亚国家起草人工智能治理规范和道德准则

摘要:据消息人士透露,东南亚国家正在起草人工智能治理规范和道德准则,以限制其风险并支持负责任和具有创新性的AI技术部署。东盟成员国可能会在年底前完成草案并在明年初的数字部长会议上正式宣布。新加坡正在牵头组织AI指南的内容谈判,并将与其他东盟国家合作制定一份“东盟AI治理和道德指南”,以支持部署负责任和具有创新性的AI技术。此前,欧盟、美国、日本和韩国也在酝酿各自的AI监管法案或行为准则。

🗼 AI知识

🔥 三个领域的微调模型

本文主要从开源的垂直领域微调模型、开源的指令微调与强化工具、开源的微调数据以及有趣的AIGC应用等几个方面的内容进行介绍,供大家一起参考。

🔥 从零解构神经网络和ChatGPT,为什么它有效? : 大神Wolfram 3万字科技雄文

Stephen Wolfram是一位计算机科学家、物理学家和商人,因其在计算机科学、数学和理论物理学方面的杰出贡献而闻名。他发明了Mathematica软件,是WolframAlpha知识搜索引擎的创始人兼首席设计师。他还是伊利诺伊大学厄巴纳-香槟分校的兼职教授。他在情人节发表了一篇3万字的文章《ChatGPT是在做什么……为什么它有效?What Is ChatGPT Doing … and Why Does It Work?》,详细解构了神经网络以及ChatGPT的底层机制,并探讨了ChatGPT可以几乎完美地与人类对话的原因。这是一篇没有复杂公式和代码的、关于ChatGPT机制探讨的最佳学习资料。 城主整理此文与大家分享,并感谢Wolfram等人无私分享和传播知识的精神。

更多AI工具,参考文心AIGC, Github-千集应用AI工具导航