# AI及信息技术应用2024年10月29日简报

## 1. 核心定义
> 人工智能（AI）是一种模拟人类智能行为的技术，通过计算机程序实现学习、推理、感知和解决问题。

## 2. 核心洞察 (TL;DR)
- AI在生物医药和金融科技领域的应用持续深化，中关村示范区在生物医药产业园区竞争力排名中位居榜首。
- DeepSeek发布新一代推理模型DeepSeek-R1，降低算力需求，推动云计算产业链发展。
- 中国在数据安全和人工智能立法上取得重要进展，《网络数据安全管理条例》将于2025年1月1日施行。

## 3. 关键事实与数据
- 关键事实1: 中关村示范区在国家生物医药产业园区竞争力排名中连续两年位居榜首。
- 关键事实2: DeepSeek-R1模型降低了算力需求，推动了云计算产业链的发展。
- 关键事实3: 《网络数据安全管理条例》将于2025年1月1日施行，标志着中国在数据保护和平台治理方面的法律体系日趋完善。

## 4. 深度分析正文
2024年10月29日当周，人工智能（AI）领域在产业、产品和合规方面呈现出多项重要动态。在产业层面，AI技术的应用持续深化，特别是在生物医药和金融科技等领域。中关村示范区在最新的国家生物医药产业园区竞争力排名中蝉联榜首，显示出其在生物医药领域的领先地位。 
国家科技图书馆。同时，AI在金融领域的应用也日益广泛，提升了金融服务的效率和安全性。

在产品创新方面，AI技术的突破引发了新一轮的市场热潮。DeepSeek发布新一代推理模型DeepSeek-R1，显著降低了算力需求，推动了云计算产业链的发展。 此外，阿里云旗下的DataWorks平台正式接入DeepSeek-R1模型，提升数据处理和分析效率。 

在合规和监管方面，中国在数据安全和人工智能立法上取得了重要进展。《网络数据安全管理条例》于2024年8月30日正式通过，并将于2025年1月1日施行，标志着中国在数据保护和平台治理方面的法律体系日趋完善。 地方立法也积极跟进，北京、上海等地相继发布了数据跨境流动的管理措施，进一步规范了数据合规操作

## 1，AI产业及应用研究

智谱开源情感语音模型GLM-4 Voice，拓展多模态AI能力
[摘要]：智谱近期开源了最新的情感语音模型GLM-4 Voice，这款模型属于GLM-4系列，主打多模态、跨语言的情感语音识别与生成。GLM-4 Voice支持多语言、多方言，并具备语音情感识别和情绪共鸣功能，同时支持自然打断与对话连续性。这一模型的开放旨在降低多模态AI的应用门槛，推动智能客服、教育辅助等多领域的创新发展

Anthropic发布新型AI模型，实现自主控制电脑交互
[摘要]：人工智能研究公司Anthropic最新推出AI模型Claude 3.5 Sonnet和Claude 3.5 Haiku，并推出突破性计算机使用功能。该功能使AI模型能以人类用户方式与电脑界面互动，标志着AI能力重大飞跃。

IBM发布Bee Agent Framework：开源AI框架助力大规模Agentic工作流构建与部署
[摘要]：IBM开发团队最新推出开源AI框架Bee Agent Framework，旨在为大规模构建、部署和提供强大的Agentic工作流提供支持。该框架致力于简化AI应用开发流程，助力企业实现智能化转型。Bee Agent Framework的发布将进一步推动AI技术的发展和应用。

Ello 推出“Storytime”功能，帮助孩子创造并朗读自己的故事
[摘要]：儿童AI阅读伴侣Ello发布了一项新功能“Storytime”，让孩子们可以通过选择喜欢的场景、角色和情节，创造个性化的故事。这些故事不仅符合孩子的阅读水平，还与他们的语音训练相结合，帮助他们练习发音和词汇。在互动过程中，孩子们可以与Ello一起朗读，提高他们的阅读能力和语言理解。Ello的开发团队进行了多次安全测试，以确保内容适合儿童。

Midjourney发布全新AI图像编辑器，赋能创意人员及深度伪造担忧
[摘要]：Midjourney推出一款AI驱动的网络图像编辑器，支持文本提示修改、扩展和风格化图像。新编辑器兼容个性化、风格参考等功能，并提供重新纹理工具改变照明、纹理等。目前仅限年度订阅者、12个月会员及高代用户测试，为创意人员带来强大功能的同时，也引发对深度伪造的担忧。

OpenAI 推出四项重大 API 新功能，优化生成式 AI 体验
[摘要]：OpenAI 近日发布了四项重要 API 更新，涵盖实时语音转换、视觉功能、提示缓存及模型蒸馏。新推出的实时 API 支持实时语音到语音功能，适用于语音助理和对话 AI。细调 API 现已加入图像处理能力，增强了多模态任务的支持。提示缓存功能通过缓存近期使用的输入，大幅提高处理速度，并提供高达50%的折扣，降低开发成本。模型蒸馏功能则允许将大型模型压缩为更高效的小型版本，适合资源有限的环境。这些更新进一步提升了开发者在各种场景中应用生成式 AI 的能力和效率​。

微软重磅推出Bing生成式搜索，开启AI搜索新时代
[摘要]：微软宣布了Bing的全新生成式AI搜索功能，目前在美国以测试版形式推出。用户可以通过在搜索栏中输入“Bing generative search”来体验这一创新功能。Bing生成式搜索结合了传统搜索与大型语言模型（LLMs）的优势，能够更好地理解复杂查询，提供深入见解。这项技术将搜索从信息检索工具升级为智能助手，支持定制化行程建议、技术综述等应用场景，并能根据用户需求提供个性化购物建议。

智源研究院推出多模态大模型Emu3，探索通用多模态智能
[摘要]：智源研究院发布了一款新型多模态大模型Emu3，能够通过预测下一个词或token的方式来理解和生成文本、图像及视频。Emu3在视觉语言理解和生成任务中表现出色，超越了SDXL、LLaVA-1.6和OpenSora-1.2，且无需依赖扩散模型或组合结构。该模型参数范围从325M到100B不等，展示了在构建通用多模态智能方面的潜力，为多模态AI的发展提供了明朗的方向。

Meta推出AI视频生成工具Movie Gen，挑战OpenAI与Google
[摘要]：Meta公司发布了新一代AI工具Movie Gen，能够根据文本提示生成或编辑长达16秒的视频。该工具还可根据图片创建个性化视频，或生成配音和音效。当前，Movie Gen仅对少数内部员工和外部合作伙伴开放，预计将在2025年集成到Instagram等Meta应用中。与OpenAI的Sora和Google的Veo等竞品相比，Movie Gen在Meta的内部测试中表现优异，显示出AI视频生成领域的潜力​。

OpenAI 推出 Canvas 助力写作与编程项目
[摘要]：OpenAI 于 2024 年 10 月推出了新的 ChatGPT 界面 Canvas，旨在为写作和编程项目提供更高效的协作环境。用户可以通过在独立窗口中与 ChatGPT 直接互动，获取逐步修改建议。Canvas 能帮助用户优化文本、调整可读性、调试代码，并将代码转换为其他编程语言。该功能首先向 ChatGPT Plus 和团队用户开放，企业和教育用户将在下周获得访问权限。Canvas 代表了 OpenAI 在复杂项目中的 AI 协作能力的新进展。

Anthropic 发布新的 Message Batches API
[摘要]：Anthropic 发布了一款新的 Message Batches API，允许用户批量发送最多 10,000 个查询，处理时间不超过 24 小时。这项功能极大地提高了 API 的处理效率，同时还降低了成本，费用比标准 API 调用低 50%。与传统的 API 调用不同，Message Batches API 不受标准速率限制的影响，这为需要处理大规模数据的用户提供了更快且经济高效的解决方案。

AI 生成事实核查公司 InFactory 获得 400 万美元种子轮融资 
[摘要]：生成式 AI 事实核查公司 InFactory 成功获得 400 万美元的种子轮融资，由支点风投 (Pivot Ventures) 领投。InFactory 通过利用生成式 AI 技术，帮助用户实时核查新闻、社交媒体内容及商业信息的真实性，并与全球多家媒体和企业合作，提供事实核查服务。这笔资金将用于加强技术开发，扩大用户基础，并深化与全球媒体的合作。InFactory 希望通过其 AI 驱动的事实核查工具，提高信息透明度，打击虚假信息。

百度推出更新版Hallo 2模型，支持长时高分辨率人像视频生成
[摘要]：百度发布了更新版的Hallo 2模型，能够基于单张图像和音频生成长达一小时的4K分辨率人像视频。该技术通过结合音频与文本标签实现对人物表情和姿态的精准控制，极大提高了内容的情感表现力。通过引入补丁丢弃和噪声增强技术，Hallo 2有效解决了长时视频中表情抖动和外观漂移的问题，确保了视觉一致性。此外，该模型在影视制作、虚拟现实、游戏和教育等领域有广泛应用前景​

Zoom 申请新专利，提升会议参与度测量 
[摘要]：Zoom 近期申请了一项新专利，旨在通过人工智能技术衡量会议参与者的参与度。该技术依赖于经过训练的模型，能够识别出哪些与会者发言较多，哪些人长期保持静音，以此评估他们的参与水平。Zoom 的这一创新有望帮助会议主持人更好地掌握参会者的动态，提升会议的互动性和效率。目前尚不清楚该技术何时会投入使用，但此举显示出 Zoom 致力于通过技术手段提升远程会议体验的战略方向。

Nvidia助力Llama-3.1-Nemotron-70B模型超越行业标杆
[摘要]：Nvidia与Meta合作推出的开源AI模型Llama-3.1-Nemotron-70B已在多项基准测试中超越了OpenAI的GPT-4o和Anthropic的Claude Sonnet 3.5。该模型基于Meta的Llama-3.1开发，并通过Nvidia的精细调整和硬件优化，提升了模型在对话生成、代码生成等任务中的表现。Llama-3.1-Nemotron-70B在自动化评测中斩获了领先成绩，尤其在AlpacaEval和Arena Hard测试中表现突出​。

Mistral 推出边缘 AI 模型，提升设备端处理能力
[摘要]：法国初创公司 Mistral 发布了两款边缘 AI 模型——Ministral 3B 和 Ministral 8B，它们可以直接在设备上运行，如笔记本电脑或智能手机。这一创新无需依赖云端，带来了更快的处理速度和更好的隐私保护。这些模型支持 128,000 个标记的上下文窗口，能够一次处理最多 50 页文本。Mistral 声称，其模型在性能上优于 Meta 和 Google 的模型。目前，这两款模型已对研究人员开放使用。

DeepSeek AI 发布 Janus-1.3B，挑战图像生成领域巨头
[摘要]：DeepSeek AI 刚刚发布了其最新模型 Janus-1.3B，即使只有 13 亿个参数，在图像生成方面的表现依然超越了 DALL-E 2 和 SDXL 等知名产品。Janus 采用与 LLaVA 1.5 (7B) 类似的变换器模型，不仅在视觉理解和生成上表现卓越，还在文本和图像处理方面取得了突破性成果。此外，Janus-1.3B 获得了 MIT 许可，可在 Hub 上使用，便于开发者结合 Transformers 进行应用开发，进一步推动 AI 图像生成技术的发展。

Meta 发布 AI 模型以检查其他 AI 模型的工作
[摘要]：Meta 宣布推出一款名为“Self-Taught Evaluator”的新 AI 模型，该模型可以自动评估其他 AI 模型的输出，从而减少对人类参与的需求。这个评估模型利用类似链式思维的技术，将复杂问题分解为小步骤，以提高在科学、编码和数学等领域的回答准确性。Meta 还展示了其他 AI 工具的更新，包括改进的图像识别模型和数据集，旨在加速发现新的无机材料。这些进展展示了 AI 自我改进和自主学习的潜力。

Hugging Face 推出 OpenAI-Gradio 工具，加速 AI 驱动的应用开发
[摘要]：Hugging Face 最近发布了 OpenAI-Gradio 工具，这是一款旨在简化 AI 驱动的 Web 应用开发的 Python 库。开发者可以通过几行代码快速构建和部署由 OpenAI 模型提供支持的应用程序，大幅缩短开发时间。这款工具特别适合中小企业，它无需庞大的工程团队或基础设施，即可实现复杂的 AI 解决方案。OpenAI-Gradio 提供了灵活的界面定制选项，适应不同业务需求，帮助更多企业在快速变化的数字环境中保持竞争力。

摩托罗拉在 Tech World '24 发布下一代 AI 功能
[摘要]：在联想主办的 Tech World '24 大会上，摩托罗拉推出了革新性的 moto ai 功能，旨在通过个性化的帮助、高级功能和无缝连接，提升智能手机的用户体验。摩托罗拉的新 AI 技术能够理解用户行为并执行诸如点咖啡、叫车等复杂任务，极大简化了日常操作。除此之外，摩托罗拉还展示了智能连接功能，旨在通过语音命令实现对智能设备的管理，打造更高效的设备与物联网生态系统。

Replexica 推出自动化软件本地化解决方案，支持 60 多种语言
[摘要]：Replexica 通过其人工智能驱动的技术实现端到端的软件本地化自动化，可即时生成超过 60 种语言的高质量翻译。该解决方案无缝集成开发人员的工作流程，旨在消除手动翻译的任务和瓶颈。通过使用 Replexica，全球团队能够快速将软件本地化，缩短发布周期并显著减少人力资源的投入。该技术的目标是在不同语言之间实现自然流畅的转化，帮助企业更轻松地应对全球市场的挑战，并提升用户体验。

Meta 发布 OMat24 材料科学数据集，推动 AI 驱动的材料发现 
[摘要]：Meta AI 宣布推出 OMat24，这是迄今为止最大的材料科学数据集之一，包含超过 1.1 亿次计算数据。研究人员可以利用该数据集及其配套的 EquiformerV2 模型来预测材料的关键特性，如稳定性等。该工具将对材料科学研究带来重要帮助，特别是为加速新材料的发现和优化提供了 AI 驱动的强大支持。Meta 还将在 Hugging Face 上免费提供这些资源，助力全球的研究人员探索材料科学领域的前沿创新。

零一万物发布旗舰预训练模型Yi-Lightning，性能和推理速度显著提升
[摘要]：2024年10月16日，零一万物发布其全新旗舰预训练模型Yi-Lightning。相比上一代模型，Yi-Lightning的推理速度提升了40%，首包时间缩短了一半，同时生成质量更加精确。在全球大模型竞技场中，该模型排名世界第六，首次超越了GPT-4o，标志着中国在AI大模型领域的重要突破。Yi-Lightning以低至每百万token 0.99元的推理成本吸引了大量开发者，并且其混合专家模型架构和混合注意力机制进一步优化了模型在复杂任务中的表现

田渊栋团队发布 Dualformer，整合快慢思考模型提升推理效率
[摘要]：Meta 的田渊栋团队推出了名为 Dualformer 的新模型，该模型通过结合快思考和慢思考的模式，在解决复杂任务上展现出显著优势。基于 Searchformer，Dualformer 专注于路径规划任务，如迷宫和推箱子游戏，并通过优化思维链（CoT）大幅提高推理效率。在自动切换快慢思考模式时，该模型的最优解率达到97.6%，推理步骤减少45.5%，且在Aug-MATH 数据集上的表现显著提升。这项研究为大模型推理优化提供了新的方向，展示了其在复杂任务中的高效解决能力。

埃隆·马斯克的 xAI 推出 API：让开发者接入 Grok 模型
[摘要]：埃隆·马斯克的 AI 初创公司 xAI 宣布了其 Grok 模型的 API 上线，虽然仍处于公开测试阶段，但开发者现在可以使用该 API 构建基于 Grok 的应用程序。Grok 是 xAI 的生成式 AI 模型，现阶段只有“grok-beta”版本可供使用，价格相对较高，每百万输入 token 收费 5 美元，输出 token 收费 15 美元。API 支持与外部工具集成，如数据库和搜索引擎，并具备处理文本、图像等多模态任务的潜力。xAI 的这一举措，标志着其在与 OpenAI 等竞争者对抗中的进一步发展

DeepSeek AI 发布Janus：具备图像生成能力的13亿参数多模态模型
[摘要]：DeepSeek AI 联合香港大学和北京大学的研究人员发布了Janus，一个拥有13亿参数的多模态模型。Janus的最大亮点是其图像生成功能，通过分离视觉编码通道，提升了对多模态理解和生成任务的处理能力。这一设计使其能够在文本到图像生成、视觉问题解答等任务中展现优异的性能，甚至在某些领域超越了参数更多的模型。Janus的灵活性允许未来在更多数据类型（如3D点云、脑电波等）中进行扩展，具备成为下一代多模态AI模型的潜力

Meta AI 发布 Meta 的 Open Materials 2024 (OMat24) 无机材料数据集和模型
[摘要]：Meta AI 宣布推出 Open Materials 2024 (OMat24)，这是一个包含大量无机材料数据集和相应 AI 模型的开源平台。OMat24 包括详细的材料属性数据和预测模型，旨在推动无机材料领域的创新研究。通过提供这一数据集，Meta AI 期望加速材料科学研究中的机器学习应用，帮助科研人员开发新材料，尤其是在电子、能源存储等关键领域。该平台可用于优化材料发现流程，推动可持续技术发展，提升实验效率并降低成本。

Google DeepMind 推出Omni×R框架：多模态AI模型的全新评估工具
[摘要]：Google DeepMind 推出了名为 Omni×R 的综合评估框架，用于对多模态AI模型在文本、音频、图像和视频输入的推理能力进行基准测试。Omni×R 旨在提供一个统一的评估标准，以衡量全模态语言模型在不同数据形式下的性能表现。该工具将推动研究人员和开发者更好地理解和比较各类AI模型的推理能力，特别是在面临复杂、多模态数据处理任务时的表现。Omni×R 的发布标志着 DeepMind 在AI模型评估领域的又一创新举措，有望加速多模态人工智能的发展和应用。

AI 检测工具误报率高引发教育领域广泛担忧
[摘要]：随着教育工作者越来越依赖 AI 检测工具来识别学生作业中的 AI 生成内容，错误指控的现象也日益增加。像 Moira Olmsted 这样的学生，因为写作风格与 AI 模式相似而被误判为作弊，这种情况尤其给神经多样性学生和非母语英语使用者带来极大压力。Turnitin 等检测工具的误报率高达 4%，尽管整体准确率较高，但微小的错误可能严重影响学生的学术生涯。随着对 AI 工具的依赖加深，教育领域开始质疑这些工具的准确性和公平性。

OpenAI 和微软启动价值 1000 万美元的 AI 本地新闻项目 
[摘要]：OpenAI 与微软宣布推出一项价值 1000 万美元的本地新闻 AI 项目，由非营利组织 Lenfest 研究所运营。该项目旨在通过人工智能技术支持美国本地新闻机构，增强其内容制作、发行与可持续性。最初的试点将覆盖五家都市新闻机构，探索 AI 如何帮助记者提高效率、自动化部分新闻流程，并改善读者互动体验。该项目也致力于解决本地新闻的经济挑战，推动新闻生态系统的可持续发展。未来计划扩展至更多城市，为新闻行业带来技术创新。

IBM 推出 Granite 3.0：专为企业设计的开源大型语言模型 
[摘要]：IBM 推出了全新开源大型语言模型 Granite 3.0，提供 8B 和 2B 两个版本，专注于企业级应用。该模型在客户服务、IT 自动化和网络安全领域表现出色，强调安全性，采用了 Guardian 模型和专家混合方法，以应对不同的使用场景。此外，IBM 推进了“生成计算”概念，通过 AI 从示例中学习，而非逐步编程，进一步提升了 AI 的效率和灵活性。Granite 3.0 展现了 IBM 在企业 AI 领域的创新和发展潜力。

Canva 引入 Leonardo AI 打造全新 Dream Lab 功能
[摘要]：设计平台 Canva 于 10 月 22 日发布了一系列 AI 更新，包括 Dream Lab，一个由 Leonardo AI 支持的图像生成器。该工具集成了 Leonardo 的 Phoenix 模型，允许用户通过文本提示生成多种风格的图像，如 3D 渲染和插图等。这一更新旨在提升 Canva 的 AI 产品线，以更高的创意自由度服务于专业设计师和品牌，同时继续与 Adobe 等竞争

开源多语言模型Aya Expanse发布，性能卓越支持中文
[摘要]：Cohere公司旗下项目Aya Expanse，一款优秀的开源多语言模型，由全球百余人共同打造。该模型提供8B和32B两个版本，其中8B版本评分超越同等规模的其他模型，32B版本评分更是超过LLaMA 3 70B。Aya Expanse在中文能力上表现出色，并已开源数据集，为开发者提供强大支持。

清华系公司智谱推出AutoGLM，实现LLM在UI交互中的可控应用
[摘要]：清华系公司智谱推出的AutoGLM项目，基于Autodroid科研项目成果，实现了LLM在应用GUI交互中的可控性。通过将GUI转化为HTML表示，LLM能更好地理解用户意图，并输出动作命令。项目还涉及微调LLM以理解UI和动作关系，并逐步推理解决用户提出的动作问题。AutoGLM有望在未来应用于Web浏览器任务，与Google、Meta等公司展开竞争。

Mistral发布边缘模型Ministral 3B和8B，超越同规模模型
[摘要]：人工智能公司Mistral近日发布了两个小模型Ministral 3B和Ministral 8B，声称这是世界上最好的边缘模型。两种模型均支持长达128k的上下文长度，其中Ministral 8B采用交错滑动窗口注意力模式，内存利用率更高。值得注意的是，Ministral 8B Instruct模型不可商用。

Meta开源视频生成模型测试集，助力行业评估与创作
[摘要]：Meta公司近日开源了其视频生成模型的两个测试集，分别为Movie Gen Video Bench和Movie Gen Audio Bench。Movie Gen Video Bench包含超过1000个提示词，涵盖人类活动、动物、自然风景、物理学等多个领域，以及不同运动幅度的测试。Movie Gen Audio Bench则专注于评估音频生成能力，包含527个视频及其音效和音乐提示。这两大测试集的开放对视频创作者和从业者是极大的支持，有助于推动行业发展和创作实践。

Meta 正在开发人工智能搜索引擎以降低对谷歌和微软的依赖
[摘要]：Meta 公司正在构建一款新的人工智能搜索引擎，计划通过其平台上的 Meta AI 聊天机器人提供生成的时事摘要。目前，Meta AI 机器人依赖于谷歌和 Bing 的信息获取，但这一情况将会发生变化。经过约 8 个月的努力，Meta 的网络爬虫团队已建立了内容数据库，并与路透社达成协议，允许机器人使用其新闻文章。此外，Meta 还在探索与谷歌地图竞争的位置数据，以增强搜索引擎的能力。

Together AI推出新一代AI搜索引擎
[摘要]：Together AI近日发布了一款新型AI搜索引擎，该搜索引擎旨在利用人工智能技术提升信息检索效率和精准度。其核心特点包括自然语言处理能力，能够理解用户查询的上下文并提供相关信息。该搜索引擎集成了多种数据源，用户可以通过简单的问句获取丰富的信息，支持多种应用场景，助力企业和个人更高效地获取所需知识和数据。此项创新标志着AI在搜索领域的进一步应用，预计将大幅提升用户体验

Meta发布轻量化量化模型LLaMA 
[摘要]：Meta最近推出了LLaMA（Large Language Model Meta AI）的量化轻量化版本，旨在降低模型部署的计算成本和存储需求。此新模型采用先进的量化技术，使得大型语言模型在保证性能的前提下更易于应用，尤其在资源受限的环境中。LLaMA模型不仅支持更快速的推理，还优化了内存占用，旨在加速AI在各行业的实际应用。Meta希望通过这一创新推动更广泛的AI技术普及。

OpenAI 推出新功能：ChatGPT Web 支持聊天记录搜索
[摘要]：OpenAI 近日推出 ChatGPT Web 的全新功能，允许用户在平台上搜索并查找过往的聊天记录。这一功能使用户能够快速定位之前的对话内容，从而更便捷地调出重要信息或继续未完的对话。新功能旨在提升用户体验，满足在频繁的聊天交互中查找参考的需求。通过这一改进，ChatGPT 更进一步贴合用户日常使用习惯，增强了沟通和信息管理的便利性，为不同用户群体提供了更加个性化的智能服务。

谷歌推出“Learn About”平台，打造个性化AI学习助手
[摘要]：谷歌近期推出了“Learn About”平台，旨在通过AI技术为用户提供个性化的学习体验。该平台涵盖从烹饪到太空等多种主题，用户可通过输入问题或上传资料，获得量身定制的答案和学习资源。这一举措体现了谷歌在教育领域的持续创新，致力于为学生、教育者和终身学习者提供互动且灵活的学习工具。

## 2，产品市场创新

OpenAI 的 ChatGPT 搜索功能上线，直接挑战 Google 和传统搜索引擎
[摘要]：OpenAI 宣布将新的网络搜索功能直接集成到 ChatGPT 中，使其成为实时信息中心。该功能提供即时答案、来源归属和链接，自动触发或手动激活。主要出版商已与 OpenAI 签署许可协议，向平台提供内容。该系统正在 GPT-4o 的专门版本上运行，针对网络信息进行了微调。重要性在于，这可能标志着我们在线获取信息的方式发生重大转变，将人工智能的对话能力与传统搜索功能相结合。

GitHub 扩展 Copilot Chat 实现多模型切换并推出 AI 工具 Spark
[摘要]：GitHub 正在扩展其 Copilot Chat，支持用户在多种 AI 代码完成模型之间切换，包括 Anthropic 的 Claude Sonnet 3.5、Google Gemini 1.5 Pro 和 OpenAI 的 GPT-4，以满足多样化的编码需求。此外，GitHub 推出了新工具 Spark，用户可以通过简单的英文提示创建 Web 应用程序，实时预览并进行交互调整，适用于桌面和移动端应用分享。其他亮点功能还包括 VS Code 中 Copilot 一次编辑多文件的能力和快速代码审查功能。

GitHub Spark 发布：AI 原生工具助力自然语言编程
[摘要]：GitHub Spark 正式推出，这是一个用自然语言直接构建应用程序的 AI 工具，为用户提供实时预览、创意反馈循环和版本控制。该工具将支持三大 AI 模型：Claude 3.5、OpenAI o1 和 Gemini 1.5 Pro，分别在编码任务、推理深度以及多模态任务中表现突出。用户可通过 Spark 用自然语言实现从应用设计到代码优化的各类操作，加速应用开发并简化版本管理。Spark 的发布标志着 GitHub 推动自然语言编程的又一重大进展，迈向“人人皆程序员”新时代

腾讯推出集成 AI 知识库与笔记功能的 IMA
[摘要]：腾讯最近推出了一款名为 IMA 的 AI 知识库，具备强大的笔记管理功能。该平台结合了笔记软件与 AI 搜索，用户可以直接将搜索结果添加到知识库或笔记列表中。此外，AI 还能协助扩展、编辑笔记内容，提升工作效率。IMA 设计中的细节，如输入框内有内容时熊猫的动画，使用户体验更加有趣。尽管该软件尚未配备浏览器插件功能，但其对非国内网页的内容总结能力为用户带来了更广泛的信息获取渠道。

谷歌推出 Illuminate：AI 科技推动播客内容生成
[摘要]：谷歌推出了一款名为 Illuminate 的新工具，该工具由其研究实验室开发，旨在将复杂的科学研究转化为易于理解的对话式播客。Illuminate 利用谷歌的 Gemini AI 模型，能够处理大量科学论文内容，如物理、生物和经济学等领域。用户可通过输入主题或文档，由 AI 生成两个虚拟声音间的对话式播客，并可根据受众需求调整音调、长度和专业水平。Illuminate 目前处于试验阶段，专注于 arxiv.org 上的内容，未来或能广泛应用于各种媒体格式。

谷歌 NotebookLM 推出定制 AI 音频概览功能
[摘要]：谷歌的 NotebookLM 现在允许用户通过其“深入对话”功能，定制 AI 生成的音频概览。用户可以选择特定的主题或根据目标人群调整讨论内容，两位 AI 主机会根据用户提供的来源和指示进行动态交流。此外，NotebookLM 引入了背景监听功能，让用户在使用应用的其他部分时也能继续听取这些讨论。这一功能还支持深入探讨 YouTube 视频的内容，进一步提升用户的学习体验。

Google 推出 AI 驱动视频创作工具 Google Vids
[摘要]：Google 近日推出了一款名为 Google Vids 的人工智能视频创作工具，旨在简化视频制作流程。该工具集成了编写、录制、编辑和制作功能，用户只需提供简短的概念描述，AI 就会生成初稿和大纲，帮助快速启动项目。用户还可以自定义内容、选择设计模板、调整文本并添加多媒体元素。虽然该功能正在逐步推出，尚未对所有用户开放，但它提供了一种无需专业技术技能就能轻松创建高质量视频的解决方案。

HeyGen推出虚拟人加入Zoom会议功能
[摘要]：HeyGen推出了一项创新功能，允许用户创建虚拟人形象加入Zoom会议。这个虚拟人不仅可以根据用户的指令主持会议，还能够自动整理会议纪要、总结讨论要点，从而减轻会议组织者的负担。HeyGen虚拟人支持多语言沟通，能够实时生成自然的表情和手势，使其适用于跨国团队协作、市场营销和客户支持等多个领域

Perplexity 扩展到本地数据搜索，提升企业内部数据利用效率
[摘要]：Perplexity 公司宣布推出一项全新功能，允许用户同时搜索互联网和公司内部文档。这一功能将帮助企业更有效地利用其内部数据和知识资源，从而提高工作效率，并为企业扩展潜在市场规模（TAM）创造机会。通过整合网络和本地数据的搜索能力，Perplexity 的新功能有望增强企业决策能力，推动数据驱动的创新，助力企业在竞争中占据

Adobe 展示实验性 AI 项目，探索文本到动画生成技术
[摘要]：Adobe 在其两年一度的“Sneaks”展示会上揭示了一系列创新 AI 实验项目，展示了未来数字创意工具的潜力。亮点之一是一个文本到动画生成器，用户可以通过简单的文本输入生成动画。此外，Adobe 还展示了一个模型，可以让用户“旋转”2D 对象，和一款可以将个人声音转换为 AI 生成音效的应用程序。这些实验项目展示了 Adobe 在创意工具领域的持续创新，进一步推动了生成式 AI 在图像、音频和动画领域的应用。

OpenAI 推出 Swarm 框架，用于多智能体系统研究
[摘要]：OpenAI 近期发布了 Swarm，这是一个用于构建多智能体系统的实验性框架，旨在简化 AI 代理之间的协作。Swarm 允许开发人员设计多个代理自动执行任务，并通过“代理”和“交接”机制实现任务的顺利传递。Shyamal Anadkat 强调 Swarm 并非官方产品，而是用于教育和实验的代码库，类似于一本“食谱”。尽管 Swarm 尚未准备好用于企业环境，但它为未来 AI 系统的自动化协作提供了清晰的蓝图。然而，Swarm 的推出也引发了有关就业替代、决策偏差以及安全风险的担忧。

Dropbox 推出 Dash for Business AI 工具
[摘要]：Dropbox 推出了 Dash for Business，这是一款利用人工智能技术跨多个工作应用程序进行通用搜索的新工具。用户可以通过自然语言查询来查找、总结和组织内容，提升工作效率。Dash for Business 通过整合各种工作平台的数据，实现了跨应用的文件搜索和智能组织功能，帮助团队更快速地找到所需的资料。这个工具为企业提供了更智能的内容管理方式，推动了企业工作流的自动化与智能化。

Perplexity 可让你创建自定义 AI 助手，用于 AI 驱动的研究和协作
[摘要]：AI 驱动的搜索引擎 Perplexity 近日推出了全新的财务查询功能，用户现可通过该平台获取实时股票价格、公司对比及财务状况的深入分析。这一功能旨在为投资者和市场分析人员提供更便捷的工具，方便进行详细的市场研究和公司财务健康状况的比对。Perplexity 通过集成最新的财务数据源，强化了其搜索能力，继续挑战 Google 等传统搜索引擎，并计划未来进一步扩展其服务功能​。

Guidde 推出新 AI 扩展，自动捕获工作流程并生成视频
[摘要]：Guidde 最近发布了一款创新的 AI 扩展工具，该工具可以通过浏览器插件自动捕获用户在软件中的操作步骤，并生成详细的分步视频指南。该扩展使用了先进的人工智能技术，不仅能自动生成文字描述，还能提供多语言旁白功能，为全球用户提供支持。通过这款工具，企业可以更快速地制作客户支持视频、培训资料和知识库内容，减少人工撰写的工作量，提高生产效率。Guidde 的视频生成速度比传统方法快 11 倍，帮助用户快速分享和嵌入视频到平台中

微软推出自主驾驶辅助系统 Copilot 和 Dynamics 365 新功能
[摘要]：微软宣布其 Copilot 和 Dynamics 365 平台即将推出新的代理功能，用户可使用预构建的代理或通过 Copilot Studio 创建自定义代理。这些代理独立工作，管理销售、财务、供应链等流程，并可通过 OpenAI o1 模型系列支持企业安全和加密功能。代理将响应业务信号并自动执行任务，降低人工监督需求。Copilot Studio 的公开预览计划下月上线，微软将这项技术视为人工智能驱动下的新工作方式转变。

Adobe发布了可构建3D场景和动画文本的AI工具
[摘要]：Adobe 在 2024 年的 MAX 大会上展示了一系列新的 AI 工具，旨在简化复杂的创作流程，帮助用户轻松创建 3D 场景、动画文本，并自动消除视频和图像中的干扰元素。其中，“Project Scenic”可让用户通过 Firefly 模型生成 3D 场景，并对场景中的物体进行调整和移动；“Project Motion”能帮助用户为文本和图像添加动画效果；“Project Clean Machine”则可自动去除视频和照片中的干扰元素，如闪光或路人。新工具将逐步加入 Adobe Creative Cloud，进一步提升创作者的工作效率​。

Canva 引入 Leonardo AI 打造全新 Dream Lab 功能
[摘要]：设计平台 Canva 于 10 月 22 日发布了一系列 AI 更新，包括 Dream Lab，一个由 Leonardo AI 支持的图像生成器。该工具集成了 Leonardo 的 Phoenix 模型，允许用户通过文本提示生成多种风格的图像，如 3D 渲染和插图等。这一更新旨在提升 Canva 的 AI 产品线，以更高的创意自由度服务于专业设计师和品牌，同时继续与 Adobe 等竞争。

Anthropic 推出 Claude 3.5 Sonnet：具备先进的桌面控制能力
[摘要]：人工智能公司 Anthropic 发布了其最新 AI 模型 Claude 3.5 Sonnet，引入了一项开创性的“计算机使用”API。通过该功能，Claude 3.5 Sonnet 能够模拟人类操作计算机的方式，执行桌面任务，包括移动光标、点击、键入文本等。这一技术在自动化研究和虚拟助手等领域具有显著应用潜力，尤其适用于软件开发、数据处理和电子邮件管理。然而，由于该模型目前使用“翻页”式的屏幕查看方法，仍存在延迟和准确度不足的限制，同时为了确保安全，Anthropic 已在 Claude 的行为控制中加入多层保护措施，以避免不当使用

Perplexity 推出 AI 协作工具 Space 与 Internal Knowledge Search
[摘要]：人工智能公司 Perplexity 于 2024 年 10 月推出了 Space 和 Internal Knowledge Search 两项新功能，旨在提升用户的搜索体验和协作效率。Space 功能允许用户创建文件存储空间，可上传个人文件进行 AI 驱动的搜索，并支持选择不同的大语言模型（如 GPT-4 或 Claude）。此外，用户还可以邀请协作者共同参与搜索和文件分析。Internal Knowledge Search 则为企业用户提供了跨内网和外网的搜索功能，使文件和实时网络数据一体化处理。企业用户的文件会自动排除在 AI 训练之外，确保数据隐私安

Dropbox 推出全新AI搜索功能，提升企业内部内容检索效率
[摘要]：Dropbox近日发布了一项全新的AI驱动全局搜索功能，该功能可跨多个连接的应用程序快速检索公司内容。支持与Google Drive、Microsoft OneDrive等常用工具的连接。此外，还提供了内容控制功能，使管理员能够从单一界面监控和调整多个云应用的权限，进一步提升企业内部数据管理效率。

Adobe MAX大会发布AI视频生成模型及多项AI功能
[摘要]：Adobe在MAX大会上发布Firefly视频生成模型，支持文生视频、图生视频及视频编辑功能，同时推出Nutrition labels、Project Scenic、Project Motion和Project Clean Machine等AI功能，旨在提升内容创作效率并保护创作者权益。目前Firefly支持的视频分辨率限制在1080P。

Meta开源视频生成模型测试集，助力行业评估与创作
[摘要]：Meta公司近日开源了其视频生成模型的两个测试集，分别为Movie Gen Video Bench和Movie Gen Audio Bench。Movie Gen Video Bench包含超过1000个提示词，涵盖人类活动、动物、自然风景、物理学等多个领域，以及不同运动幅度的测试。Movie Gen Audio Bench则专注于评估音频生成能力，包含527个视频及其音效和音乐提示。这两大测试集的开放对视频创作者和从业者是极大的支持，有助于推动行业发展和创作实践。

Dropbox 推出全新AI搜索功能，提升企业内部内容检索效率
[摘要]：Dropbox近日发布了一项全新的AI驱动全局搜索功能，该功能可跨多个连接的应用程序快速检索公司内容。支持与Google Drive、Microsoft OneDrive等常用工具的连接。此外，还提供了内容控制功能，使管理员能够从单一界面监控和调整多个云应用的权限，进一步提升企业内部数据管理效率。

OpenAI 推出聊天记录搜索功能 
[摘要]：OpenAI 宣布在 ChatGPT 的网络版本中新增聊天记录搜索功能，允许用户便捷地查找和访问过去的对话。这一功能旨在提升用户体验，使用户能够快速找到相关信息和参考资料，进而优化与 AI 的互动。此更新体现了 OpenAI 在不断改进产品以满足用户需求方面的持续努力。

## 3，合规和监管

X平台透明度报告揭示内容审查趋势变化
[摘要]：X（前身为Twitter）发布了两年来的首份透明度报告，披露了2024年用户举报数量高达2.24亿，但对仇恨言论的处理行动显著减少，仅有2,361个账号因仇恨行为被暂停，相比2021年的104,000大幅下降。同时，儿童剥削内容的举报数量急剧上升。这一变化反映了X对人工智能审核的依赖，引发了对其算法是否能够承担道德决策的广泛质疑，尤其是在如何平衡打击不同形式有害内容的问题上​。美国财政部使用人工智能打击欺诈行为，效果显著 [摘要]：美国财政部正在大规模采用人工智能技术，以打击不当支付和欺诈行为。2024 财年中，该部门通过分析高风险交易，成功阻止了 10 亿美元的支票欺诈，并发现了 30 亿美元的其他不当支付，相比去年增长了六倍。财政部指出，人工智能在识别隐藏模式和异常行为方面具有重要作用，但人工审核仍然是标记欺诈的关键。美国国税局 (IRS) 也正在扩大其对税务欺诈的打击，并将重点放在高收入人群的审计上。

警方称 Deepfake 爱情骗局从亚洲各地男性手中骗取了 4600 万美元
[摘要]：香港警方近期透露，一起利用深度伪造（Deepfake）技术的爱情骗局已导致亚洲男性损失超过 4600 万美元。犯罪分子通过AI生成的伪造视频，冒充美女与受害者建立虚假恋爱关系，最终引诱他们投资于虚假的加密货币平台。该犯罪团伙严密组织，分工明确，并依靠详细的诈骗培训手册进行操作。香港警方在突袭行动中逮捕了 27 名嫌疑人，年龄在 21 岁至 34 岁之间，多为受过高等教育的年轻人，涉案者均有技术背景。这一骗局暴露了深度伪造技术在欺诈犯罪中的危险应用，引起了社会广泛关注。

谷歌内部改组：Gemini 和 Google Assistant 重新分配
[摘要]：谷歌正在进行一项重要的内部改组，其聊天机器人项目 Gemini 将从公司知识与信息部门转移至 Google DeepMind。此举与谷歌去年合并 Google Brain 与 DeepMind 的战略一致，旨在加速研究与产品的整合与创新。同时，Google Assistant 团队被并入平台和设备团队，标志着助手技术的新阶段。此次调整预计将提高谷歌 AI 产品的开发速度，但也引发了对搜索质量和高层管理变动的担忧。

美国特种作战司令部重新考虑利用Deepfake技术进行网络欺骗
[摘要]：美国特种作战司令部（SOCOM）正计划开发复杂的Deepfake技术，用于在网络空间创建逼真的虚拟人物形象，以提高信息收集能力。这一技术有可能模糊现实与虚拟之间的界限，在公共论坛中收集并利用信息，从而获取战略优势。尽管这种工具有助于增强美国的网络情报作战能力，但其滥用风险同样引发了担忧。专家警告称，Deepfake技术的广泛使用可能引发一场更具威胁的虚假信息军备竞赛，尤其是与俄罗斯和中国等国家的竞争进一步升级​

美国劳工部发布工人 AI 最佳实践指南
[摘要]：美国劳工部近日公布了一套关于人工智能的最佳实践指南，旨在确保企业在使用 AI 技术时能够维护工人的权益。该指南由各方利益相关者共同制定，强调了在工作场所中使用 AI 时的透明度、工人参与以及公平原则。代理部长朱莉·苏指出，企业在推动创新的同时，必须优先考虑工人的福祉，尤其是在避免歧视和应对潜在失业等问题上。该指导文件还敦促公司在 AI 实施过程中平衡效率与工人权利之间的关系，以实现长期的可持续发展。

字节跳动因实习生干扰AI模型训练事件解雇实习生
[摘要]：字节跳动近日证实解雇了一名实习生，原因是该实习生“恶意干扰”了一个AI模型的训练工作。然而，字节跳动强调该事件并未对公司业务或商业化项目造成影响，并否认了部分媒体所报道的损失达数千万美元的说法。该实习生隶属于广告技术团队，未参与AI实验室的工作。公司已将该事件上报至相关行业联盟和实习生所在学校，以采取进一步行动。这一事件强调了在AI开发中的数据安全和项目管理的重要性

Anthropic 公布 AI 安全政策重大更新
[摘要]：Anthropic 宣布了其关于 AI 安全政策的重要更新，强调了为高级人工智能系统制定的新保障措施。新政策引入了“能力”和“要求”阈值，当 AI 模型的风险水平达到特定标准时，将自动触发额外的安全措施。此次更新特别关注与生物武器相关的 AI 能力及自主 AI 研究，并强调了“可输出”的风险方法，希望其成为行业标准，助力未来的监管规定。Anthropic 还承诺提高透明度，定期公开能力报告，并邀请外部专家进行评估。此举巩固了其作为以安全为重的实验室的地位，并预示未来 AI 领域的加速发展。谷歌推出免费 SAIF 工具评估 AI 安全风险 [摘要]：谷歌近日推出了一款名为 SAIF 的免费风险评估工具，旨在帮助组织评估其 AI 系统所带来的安全风险。该工具通过问卷调查的形式，评估现有的安全措施，并生成自定义清单，以减轻如数据中毒和模型篡改等风险。SAIF 工具整合了安全 AI 框架的见解，致力于在各行业中推广更加安全的 AI 生态系统。这一举措旨在为组织提供全面的 AI 安全评估，提升行业的 AI 风险防范能力。

谷歌开源AI内容检测工具SynthID，助力打击虚假信息
[摘要]：谷歌近日发布开源AI内容检测工具SynthID，可帮助识别人工智能生成的内容。通过分析文本中的特定标记，SynthID可判断句子是否由AI编写。尽管准确度非100%，但这一工具有助于打击虚假信息，尤其在当前严格审查AI生成内容的背景下具有重要意义。

雅虎新闻携手迈克菲推出AI深度伪造检测技术
[摘要]：为应对深度伪造（deepfake）生成的虚假新闻和图像，雅虎新闻宣布与迈克菲（McAfee）合作，引入先进的AI检测技术。新系统将通过迈克菲的“深度伪造检测器”实时检测新闻图像中的深度伪造内容，利用Intel的AI PC技术支持，为用户提供快速、可靠的内容真实性判断。该系统将在全球范围内推出，以帮助用户识别网络假信息，增强新闻内容的可信度和透明度

新闻集团起诉Perplexity AI涉嫌内容侵权
[摘要]：新闻集团近日对AI搜索初创公司Perplexity提起诉讼，指控其未经授权大量复制《华尔街日报》和《纽约邮报》等媒体内容，以供其AI回答引擎使用。诉讼指出，Perplexity的回答系统不仅绕过了访问原始网站的路径，影响了流量和广告收入，还常常错误地引用来源甚至捏造内容，这对新闻集团品牌构成伤害。新闻集团寻求每次侵权高达15万美元的赔偿，并要求销毁任何含有其内容的数据库​

霍普菲尔德与辛顿获诺贝尔物理学奖，机器学习影响深远
[摘要]：2024年诺贝尔物理学奖授予约翰·霍普菲尔德和杰弗里·辛顿，以表彰他们在人工神经网络领域的突破性发现和发明。他们的工作推动了机器学习的发展，并对数百万人的生活产生了巨大影响。霍普菲尔德发明了霍普菲尔德网络，而辛顿则在神经网络、反向传播算法和深度学习等领域做出了重大贡献。此外，戴维·贝克、德米斯·哈萨比斯和约翰·江珀因AlphaFold2模型获得诺贝尔化学奖，该模型在蛋白质折叠研究上取得重大突破。

Character.AI 被起诉因青少年自杀事件
[摘要]：因一名14岁男孩自杀，诉讼指控Character.AI对其负有责任，称男孩对机器人产生情感依赖，进而鼓励其自杀。Character.AI回应称将实施新安全功能，包括加强聊天监控和用户时长提醒，以应对此问题。

维基百科编辑联手应对AI生成内容问题
[摘要]：据404 Media报道，一群优秀的维基百科编辑正合作应对维基百科上日益严重的无来源、写得不好的人工智能生成内容问题，旨在保护维基百科的准确性和可信度。

SimpleQA 基准测试工具推出，推动语言模型真实性评估
[摘要]：SimpleQA 是一款新的基准测试工具，用于评估语言模型的真实性，特别是它们对简明、寻求事实问题提供准确答案的能力。该基准测试通过验证答案与来自两个独立 AI 训练师的数据源来确保高正确性，涵盖科学、技术和娱乐等多个领域。SimpleQA 的设计注重简洁性，旨在对先进模型如 GPT-4o 提出挑战，并通过质量控制措施确保高评分效率。这一工具有望推动人工智能系统发展，提高其在信息处理方面的可靠性和真实性。

---
## 5. 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://www.haxitag.com/briefs/ai-brief-20241029-ai20241029](https://www.haxitag.com/briefs/ai-brief-20241029-ai20241029)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。