继 Open AI 发布了视频生成模型 Sora 之后,Google 最近又发布了 Vlogger,一个能通过一张照片生成 10 秒视频的模型。在我们惊叹 AIGC 技术快速发展的同时,网络黑产的攻击也依托技术迭代爆发式提效。自去年以来,线上深度伪造(Deepfake)技术攻击案例指数级上升,特别是在东南亚等基础设施与监管薄弱的地区,案发占比由不到百分之零点五飙升至五。本期节目我们邀请到蚂蚁数科 ZOLOZ 的技术负责人姚伟斌(文景)来聊聊后 Sora 时代下我们普通人如何能够降低
本期节目我们将盘点「Transformer 论文八子」从谷歌离职后都创立了什么公司,在哪些 AI 领域持续研究和创新,和大家一起尝试从这几家公司里窥见生成式 AI 时代的未来格局。在过去的英伟达 GTC 大会上,创始人黄仁勋和「Transformer 八子」的对谈无疑是最受关注的论坛之一。就职于谷歌的八位研究员于 2017 年共同发表了论文《Attention is all you need》,提出自然语言处理的新架构 Transformer 模型,开启了人工智能的新时代。然而论文
2023 年,不出意料又一个「出海元年」。在早期的出海阶段,中国企业常常是将一个已经成熟的产品投放到海外市场。受「时光机理论」的启发,创业者试图在新兴市场复制中国模式 (copy from China)。过去五年,随着新一代华人创业群体创造力的提升,企业开始强调「生而全球化」(born global)。但在今年,中国创业者又往前迈进了一步,他们专注于创造出全人类都未曾拥有的东西,这一趋势在 AI 出海赛道上得到了充分的体现。在 AI 时代和全球化的大背景下,2023 年出现了哪些
Open AI 的剧情反转又反转,归根结底是因为 Open AI 现有的大部分董事,是在其初期还是非盈利机构时加入的,他们最核心的观点仍然是 AI 威胁论。在之前的一期节目 (https://guiguzaozhidao.fireside.fm/20220173)里,我们曾经讨论过,马斯克也是因为与 OpenAI 团队持不同观点而退出董事会。为了解决这个问题,马斯克采取的方案是一边开发自己的 AI (X.ai),一边创建终极对抗 AI 的解决方案 —— 通过脑机接口实现与 AI 共存
在 AI 深度伪造泛滥的时代,眼见不一定为实,有图不一定有真相。深度伪造 (Deepfake) 指的是利用 AI 深度学习技术来生成或者操纵多媒体内容,包括合成某个人的图像、视频以及声音。在 ChatGPT 等 AI 大语言模型助力下,我们所面对的已经不再是一个只有假新闻、虚假消息的世界了。最近,国内外陆续出现了利用深度伪造技术进行 AI 换脸、拟声的诈骗案例,被骗金额高达上百万,成功率甚至接近 100%。身为播客行业的工作者,我不禁思考,制作一个高度逼真的 AI 合成音频究竟有
AI 应用的井喷就在眼前,而手机是日常使用频次最高的智能设备。在手机摄影,文本翻译,玩游戏、看视频、听音乐等等这些场景中,如果手机芯片的能力足够强,我们普通人也能通过手机这样一个智能终端,真正将 AI 利用起来——这,就是端侧 AI 技术。而更令我们音频工作者感到兴奋的是:就在不久前,骁龙也公布了与 QQ 音乐的合作,将音质优化算法完全迁移到骁龙平台的高通 AI 引擎上运行,用一种前所未有的计算式路径,让经过压缩而导致音质“受损”的歌曲,重新获得那份失去的宽广、灵动,和醇厚。这不禁