第122期 |
2025-05-24 |
2025-05-24 (每周六发布)
5 有趣:
II. Google I/O 2025大会
发布Gemini 2.5 Pro深度思考模式、Veo 3视频模型、Imagen 4图片模型、Flow视频创作工具、Chrome 内置 Gemini、NotebookLM将支持视频摘要、Gemini App Live模式支持摄像头实时拍摄聊天
发布Gemini 2.5 Pro深度思考模式、Veo 3视频模型、Imagen 4图片模型、Flow视频创作工具、Chrome 内置 Gemini、NotebookLM将支持视频摘要、Gemini App Live模式支持摄像头实时拍摄聊天
IV. OpenAI 推出 Codex
这是一个软件工程 Agent,可以并行处理多个不同的编码任务,比如编写功能、回答 issue、修复 bug 等。后端了使用了特调的 o3 模型 codex-1,整体体验类似 Claude Code,但是在云端沙盒中进行,并不是本地电脑。
这是一个软件工程 Agent,可以并行处理多个不同的编码任务,比如编写功能、回答 issue、修复 bug 等。后端了使用了特调的 o3 模型 codex-1,整体体验类似 Claude Code,但是在云端沙盒中进行,并不是本地电脑。
4 工具:
I. NLWeb
微软本周发布的协议 Natural Language Web,旨在轻松地将任何网站转化为人工智能驱动的应用程序,让用户可以直接使用自然语言查询网站内容;每个 NLWeb 实例也是一个 MCP 服务器,MCP 之于 NLWeb 就如同 HTTP 之于 HTML
微软本周发布的协议 Natural Language Web,旨在轻松地将任何网站转化为人工智能驱动的应用程序,让用户可以直接使用自然语言查询网站内容;每个 NLWeb 实例也是一个 MCP 服务器,MCP 之于 NLWeb 就如同 HTTP 之于 HTML
3 文章:
有时我们就是通过创造来自我安慰的。我们写一个新工具,是因为我们急需一个小小的胜利。我们编写新工具,是因为我们不堪重负。重构它,不是因为代码凌乱,而是你的生活凌乱。
编程能给你即时反馈。你运行它,它就能工作。或者它不行 ,你就去修正它。无论如何,你都做了一些事情
II. MCP:值得关注的协议(即使您还不确定该如何使用它)
非常同意作者的观点,目前 MCP 做为 AI 代理的 HTTP 协议,缺少了很多安全方面的考量,但正如 HTTPS 一样,MCP 将来也必定需要新的协议来补足安全模块,正如作者所描述的:
非常同意作者的观点,目前 MCP 做为 AI 代理的 HTTP 协议,缺少了很多安全方面的考量,但正如 HTTPS 一样,MCP 将来也必定需要新的协议来补足安全模块,正如作者所描述的:
MCP 并不能解决这些问题,它只是让这些问题有可能通过正确的架构来解决,我们应该注意不要将结构与安全性混为一谈,它只是意味着它在按部就班地工作
2 资源:
1 订阅:
以上就是本期的全部内容啦! 感谢阅读
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----
如果您喜欢本周刊, 可以通过以下方式来支持它:
本周刊采用 CC BY-SA 4.0 许可协议进行许可。
我的观点仅代表我个人,与任何附属机构无关。内容无恶意、无广告,均由我主观决定发布。为尊重您的隐私,不进行任何跟踪。
我的观点仅代表我个人,与任何附属机构无关。内容无恶意、无广告,均由我主观决定发布。为尊重您的隐私,不进行任何跟踪。
第121期 |
2025-05-17 |
2025-05-17 (每周六发布)
5 有趣:
III. Stripe 推出稳定币 USDC 和 USDB 账户
在完成对稳定币平台 Bridge 的收购后,Stripe 推出了稳定币金融账户,将向 101 个国家的企业开放,资金可通过ACH、电汇或加密钱包转入,也可转账到银行账户或加密地址,后续还会提供支持稳定币计价的Visa卡服务
在完成对稳定币平台 Bridge 的收购后,Stripe 推出了稳定币金融账户,将向 101 个国家的企业开放,资金可通过ACH、电汇或加密钱包转入,也可转账到银行账户或加密地址,后续还会提供支持稳定币计价的Visa卡服务
IV. Sakana 推出新的神经网络架构 CTM (Continuous Thought Machine)
这是一种模拟神经活动时间演化的新方法,传统的神经网络(NN)的灵感最初来源于生物大脑,但有意抽象掉这种时间动态,以便促进大规模深度学习。但 Sakana 认为时间应该是人工智能的核心组成部分,这样人工智能才能最终达到与人类大脑相媲美或超越人类大脑的能力水平。
这是一种模拟神经活动时间演化的新方法,传统的神经网络(NN)的灵感最初来源于生物大脑,但有意抽象掉这种时间动态,以便促进大规模深度学习。但 Sakana 认为时间应该是人工智能的核心组成部分,这样人工智能才能最终达到与人类大脑相媲美或超越人类大脑的能力水平。
4 工具:
III. Starguard
这是一个命令行工具,可检测给定的 Github Repo 是否存在假冒star活动、依赖劫持、licence red-flags 和其他风险迹象,可实施自动化的开源尽职调查
这是一个命令行工具,可检测给定的 Github Repo 是否存在假冒star活动、依赖劫持、licence red-flags 和其他风险迹象,可实施自动化的开源尽职调查
3 文章:
I. 超类型
超类型(Hyper-typing)是一种将类型复杂到几乎无法使用的行为,它正在成为 TypeScript 生态系统中的一种趋势。虽然更严格的类型更安全,但往往也更复杂,编译错误产生的是一堵难以理解的文字墙。作者认为使用不那么 "完美"的库,但更简单的类型,甚至类型生成,往往会带来更实用、更愉快的开发体验。
超类型(Hyper-typing)是一种将类型复杂到几乎无法使用的行为,它正在成为 TypeScript 生态系统中的一种趋势。虽然更严格的类型更安全,但往往也更复杂,编译错误产生的是一堵难以理解的文字墙。作者认为使用不那么 "完美"的库,但更简单的类型,甚至类型生成,往往会带来更实用、更愉快的开发体验。
II. 独立开发者或将拯救电子游戏产业
探讨了在主流游戏产业面临高成本与创新瓶颈的困境下,独立开发者如何凭借其创造力、灵活性以及对游戏艺术的执着追求,不仅打造出备受赞誉的佳作,更可能为整个行业注入新的活力并指明未来方向。
探讨了在主流游戏产业面临高成本与创新瓶颈的困境下,独立开发者如何凭借其创造力、灵活性以及对游戏艺术的执着追求,不仅打造出备受赞誉的佳作,更可能为整个行业注入新的活力并指明未来方向。
2 资源:
1 订阅:
I. Techno Sapiens | [rss]
这是一份由育儿教授 Jacqueline Nesi 经营的 Newsletter,主要内容是关于儿童的屏幕时间和心理健康,以及父母如何帮助孩子驾驭技术和社交媒体的内容
-----
这是一份由育儿教授 Jacqueline Nesi 经营的 Newsletter,主要内容是关于儿童的屏幕时间和心理健康,以及父母如何帮助孩子驾驭技术和社交媒体的内容
-----
以上就是本期的全部内容啦! 感谢阅读
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----
如果您喜欢本周刊, 可以通过以下方式来支持它:
本周刊采用 CC BY-SA 4.0 许可协议进行许可。
我的观点仅代表我个人,与任何附属机构无关。内容无恶意、无广告,均由我主观决定发布。为尊重您的隐私,不进行任何跟踪。
我的观点仅代表我个人,与任何附属机构无关。内容无恶意、无广告,均由我主观决定发布。为尊重您的隐私,不进行任何跟踪。
第120期 |
2025-05-10 |
2025-05-10 (每周六发布)
5 有趣:
I. Nvidia 发布了 Parakeet V2 语音识别 (ASR) 模型
该模型仅 0.6B 大小,可在一秒钟内转录一小时的音频,同时达到商业级的准确度水平,同时还拥有时间戳、自动标点和大小写、歌词转录等功能,但仅支持英语。
该模型仅 0.6B 大小,可在一秒钟内转录一小时的音频,同时达到商业级的准确度水平,同时还拥有时间戳、自动标点和大小写、歌词转录等功能,但仅支持英语。
III. 谷歌推出 Gemini 2.5 Pro 预览版模型
本次更新具有更强大的编码功能,主要集中在前端和 UI 开发。该模型还拥有视频理解能力。在 WebDev Arena 和 Chatbot Arena 排行榜上位列第一。
本次更新具有更强大的编码功能,主要集中在前端和 UI 开发。该模型还拥有视频理解能力。在 WebDev Arena 和 Chatbot Arena 排行榜上位列第一。
IV. 微软推出新 Surface Pro 便携式电脑
分12和13英寸两个版本,均使用了高通的 Arm 架构 CPU ,还搭载了高通的 GPU 和 NPU,可实现离线运行 AI 功能。12英寸版本将在今年7月上架,13英寸版本起售价7488元
分12和13英寸两个版本,均使用了高通的 Arm 架构 CPU ,还搭载了高通的 GPU 和 NPU,可实现离线运行 AI 功能。12英寸版本将在今年7月上架,13英寸版本起售价7488元
4 工具:
3 文章:
II. 学会爱护你的遗留代码库
当你放弃旧系统、建立新系统时,你必须知道未来会有哪些挑战,您很有可能刚刚创建了下一代遗留代码,而未来的开发人员将在今后的岁月中鄙视这些代码。
在决定扔掉旧代码之前,花点时间多了解一下它,也许你会对代码和最初构建它的人产生新的敬意
III. Copilot 询问、编辑和代理模式:它们的作用和使用时机
来自 Github 官方的博文,详细介绍了 Copilot 的不同模式的区别和使用时机,也适合 Cursor、Windsurf 等工具。
来自 Github 官方的博文,详细介绍了 Copilot 的不同模式的区别和使用时机,也适合 Cursor、Windsurf 等工具。
2 资源:
I. 吉卜力工作室电影高清图片
吉卜力工作室上传了其几乎所有电影的数百张高分辨率静态图片,这些图片被标注为 "仅供个人影迷使用,以进一步欣赏吉卜力工作室的电影",并呼吁人们 "请在常识范围内自由使用这些图片"
吉卜力工作室上传了其几乎所有电影的数百张高分辨率静态图片,这些图片被标注为 "仅供个人影迷使用,以进一步欣赏吉卜力工作室的电影",并呼吁人们 "请在常识范围内自由使用这些图片"
1 订阅:
以上就是本期的全部内容啦! 感谢阅读
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----
如果您喜欢本周刊, 可以通过以下方式来支持它:
本周刊采用 CC BY-SA 4.0 许可协议进行许可。
我的观点仅代表我个人,与任何附属机构无关。内容无恶意、无广告,均由我主观决定发布。为尊重您的隐私,不进行任何跟踪。
我的观点仅代表我个人,与任何附属机构无关。内容无恶意、无广告,均由我主观决定发布。为尊重您的隐私,不进行任何跟踪。
第119期 |
2025-04-26 |
2025-04-26 (每周六发布)
5 有趣:
IV. 2025: 前沿企业诞生之年
微软发布的工作趋势指数报告,描绘了以人工智能为中心、由人类主导的 "前沿企业 "的崛起,新模式将重塑工作场所,未来的工作将由人工智能代理主导,但由人类进行管理。我们正处于工作方式全面转变的初期阶段--人类-代理团队将成为常态,公司将转向完全混合的、人工智能注入的结构;非常建议细读该报告,干货很多
微软发布的工作趋势指数报告,描绘了以人工智能为中心、由人类主导的 "前沿企业 "的崛起,新模式将重塑工作场所,未来的工作将由人工智能代理主导,但由人类进行管理。我们正处于工作方式全面转变的初期阶段--人类-代理团队将成为常态,公司将转向完全混合的、人工智能注入的结构;非常建议细读该报告,干货很多
V. 让人工智能生成的代码在任何语言中都更准确
麻省理工学院发表了一种 "顺序蒙特卡洛 "方法,可高效生成人工智能代码,通过将精力分配到最有可能有效和准确的输出上,同时在流程的早期阶段放弃不理想的输出,使小型模型的性能优于大型模型
麻省理工学院发表了一种 "顺序蒙特卡洛 "方法,可高效生成人工智能代码,通过将精力分配到最有可能有效和准确的输出上,同时在流程的早期阶段放弃不理想的输出,使小型模型的性能优于大型模型
4 工具:
II. flowith
一个 AI 生产力工具,不同于传统聊天式 AI 工具,flowith 基于二维画布的交互可以让你在一个画布中与多个 AI 模型同时交互,并进行内容生成。还有 Oracle Agent 系统,交互很强大,值得一试
一个 AI 生产力工具,不同于传统聊天式 AI 工具,flowith 基于二维画布的交互可以让你在一个画布中与多个 AI 模型同时交互,并进行内容生成。还有 Oracle Agent 系统,交互很强大,值得一试
3 文章:
I. 我在 Figma 10 年中学到的 10 件事
Claire Butler 于 2015 年加入 Figma,成为公司招聘的第一位营销人员和业务人员,她在10年后做出了离开的决定,并写出了这篇经验分享
Claire Butler 于 2015 年加入 Figma,成为公司招聘的第一位营销人员和业务人员,她在10年后做出了离开的决定,并写出了这篇经验分享
II. Vibe Coding 不是低质量工作的借口
介绍了在使用编程助理进行 Vibe Coding 时的使用指南和注意事项。
介绍了在使用编程助理进行 Vibe Coding 时的使用指南和注意事项。
最大的启示是, 没有质量,速度毫无意义 。更快地发布漏洞百出、不可维护的代码是一种虚假的胜利--你只是在加速冲向悬崖
III. 我应该在 GitHub Copilot 中使用哪种人工智能模型
来自 Github 官方的编程模型选择指南,不仅适用于 Copilot,也适用于其它编程助理工具,比如 Cursor 和 Windsurf
来自 Github 官方的编程模型选择指南,不仅适用于 Copilot,也适用于其它编程助理工具,比如 Cursor 和 Windsurf
2 资源:
1 订阅:
以上就是本期的全部内容啦! 感谢阅读
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----
如果您喜欢本周刊, 可以通过以下方式来支持它:
本周刊采用 CC BY-SA 4.0 许可协议进行许可。
我的观点仅代表我个人,与任何附属机构无关。内容无恶意、无广告,均由我主观决定发布。为尊重您的隐私,不进行任何跟踪。
我的观点仅代表我个人,与任何附属机构无关。内容无恶意、无广告,均由我主观决定发布。为尊重您的隐私,不进行任何跟踪。
第118期 |
2025-04-19 |
2025-04-19 (每周六发布)
5 有趣:
III. 研究人员测试了主流的 AI 模型在《王牌检察官》游戏中的表现
这是一款玩家必须调查犯罪现场并破案的热门游戏,人工智能在游戏中扮演侦探,收集线索,揭露矛盾,揭开真相。
测试结果:O1 和 Gemini 2.5 Pro 表现最好,新的 GPT-4.1 与几个月前的 Claude 3.5 Sonnet 表现一致。
这是一款玩家必须调查犯罪现场并破案的热门游戏,人工智能在游戏中扮演侦探,收集线索,揭露矛盾,揭开真相。
测试结果:O1 和 Gemini 2.5 Pro 表现最好,新的 GPT-4.1 与几个月前的 Claude 3.5 Sonnet 表现一致。
4 工具:
III. gh-signoff
来自 Basecamp 最近刚开源的一款工具,用于本地 CI 的 GitHub 命令行扩展。如今,开发人员的机器速度超快,但利用率却长期不足,而云 CI 服务通常又慢又贵,还是租用的,所以该工具能让开发人员在自己的机器上运行 CI,并在通过后签字确认。
来自 Basecamp 最近刚开源的一款工具,用于本地 CI 的 GitHub 命令行扩展。如今,开发人员的机器速度超快,但利用率却长期不足,而云 CI 服务通常又慢又贵,还是租用的,所以该工具能让开发人员在自己的机器上运行 CI,并在通过后签字确认。
3 文章:
I. 《过河卒》: 比特币雏形之父之父的故事
这篇博文回顾了戴习为(《过河卒》作者)历经波折最终在美国科技界取得成功的生平,并探讨了坚持不懈、终身学习、家庭环境以及“日拱一卒”式自我超越的重要性,有一定的启发和鼓舞
这篇博文回顾了戴习为(《过河卒》作者)历经波折最终在美国科技界取得成功的生平,并探讨了坚持不懈、终身学习、家庭环境以及“日拱一卒”式自我超越的重要性,有一定的启发和鼓舞
2 资源:
1 订阅:
I. The Noah Kalina Newsletter
一位居住在纽约兰伯兰的艺术家和摄影师,在这份时事通讯中,你会看到有关他的摄影项目相关的故事、幕后花絮、观察、探险。没有严格的主题,只有图片和想法的组合,他看待事物的角度很细微且很独特。
-----
一位居住在纽约兰伯兰的艺术家和摄影师,在这份时事通讯中,你会看到有关他的摄影项目相关的故事、幕后花絮、观察、探险。没有严格的主题,只有图片和想法的组合,他看待事物的角度很细微且很独特。
-----
以上就是本期的全部内容啦! 感谢阅读
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----
如果您喜欢本周刊, 可以通过以下方式来支持它:
本周刊采用 CC BY-SA 4.0 许可协议进行许可。
我的观点仅代表我个人,与任何附属机构无关。内容无恶意、无广告,均由我主观决定发布。为尊重您的隐私,不进行任何跟踪。
我的观点仅代表我个人,与任何附属机构无关。内容无恶意、无广告,均由我主观决定发布。为尊重您的隐私,不进行任何跟踪。
第117期 |
2025-04-12 |
2025-04-12 (每周六发布)
5 有趣:
I. Anthropic 相关更新
- Anthropic 推出教育版 Claude: 教育版添加了学习模式,引导学生推理过程,而不是提供答案。同时还会提供学生计划。
- 添加 Max 付费计划: $100/月起,比 Pro 版多5~20倍的使用量
- Anthropic 推出教育版 Claude: 教育版添加了学习模式,引导学生推理过程,而不是提供答案。同时还会提供学生计划。
- 添加 Max 付费计划: $100/月起,比 Pro 版多5~20倍的使用量
II. NVIDIA 发布 Nemotron-Ultra 模型
它是 Meta Llama-3.1-405B-Instruct 的衍生模型,拥有 253B 参数的开源推理模型,支持 128K 标记的上下文长度,在关键基准测试中超越 DeepSeek R1 和 Llama 4 Behemoth
它是 Meta Llama-3.1-405B-Instruct 的衍生模型,拥有 253B 参数的开源推理模型,支持 128K 标记的上下文长度,在关键基准测试中超越 DeepSeek R1 和 Llama 4 Behemoth
III. 台积电推出了 2 纳米芯片
台积电于 4 月 1 日推出了 2 纳米芯片,预计将于今年下半年量产,与 3 纳米芯片相比,在相同的功率水平下,它们的计算速度提高了 10%至 15%,或在相同的速度下,功耗降低了 20%至 30%,晶体管密度提高了约 15%
台积电于 4 月 1 日推出了 2 纳米芯片,预计将于今年下半年量产,与 3 纳米芯片相比,在相同的功率水平下,它们的计算速度提高了 10%至 15%,或在相同的速度下,功耗降低了 20%至 30%,晶体管密度提高了约 15%
IV. Windsurf Wave 7
在这次更新中,Windsurf 将 Cascade 的功能通过插件的形式带进了 JetBrains IDE
V. 2025 年人工智能指数报告
斯坦福大学发布的最新报告,使用12个图表说明了当前人工智能发展的情况。同时还提供了近400页的报告详情
在这次更新中,Windsurf 将 Cascade 的功能通过插件的形式带进了 JetBrains IDE
V. 2025 年人工智能指数报告
斯坦福大学发布的最新报告,使用12个图表说明了当前人工智能发展的情况。同时还提供了近400页的报告详情
4 工具:
IV. Glamorous Toolkit
一个很特别的 IDE,官方称其为“可塑性开发环境(MDE)”,它是一种通过自定义工具进行编程的方式,不仅提供了代码操作的基础设施,还能随着你的输入改变其形态,通过创建专门的微型工具来使系统变得可解释,重塑了整个开发体验
一个很特别的 IDE,官方称其为“可塑性开发环境(MDE)”,它是一种通过自定义工具进行编程的方式,不仅提供了代码操作的基础设施,还能随着你的输入改变其形态,通过创建专门的微型工具来使系统变得可解释,重塑了整个开发体验
3 文章:
II. 使用 AI 的能力将成为 Shopify 的基本要求
来自 Shopify CEO 的一篇内部备忘录,其中明确了在公司内使用 AI 的具体要求:
来自 Shopify CEO 的一篇内部备忘录,其中明确了在公司内使用 AI 的具体要求:
- 项目原型阶段必须使用 AI
- 绩效评估加入AI使用能力
- 资源申请前需证明AI无法解决
2 资源:
1 订阅:
以上就是本期的全部内容啦! 感谢阅读
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----
如果您喜欢本周刊, 可以通过以下方式来支持它:
本周刊采用 CC BY-SA 4.0 许可协议进行许可。
我的观点仅代表我个人,与任何附属机构无关。内容无恶意、无广告,均由我主观决定发布。为尊重您的隐私,不进行任何跟踪。
我的观点仅代表我个人,与任何附属机构无关。内容无恶意、无广告,均由我主观决定发布。为尊重您的隐私,不进行任何跟踪。
第116期 |
2025-04-05 |
2025-04-05 (每周六发布)
5 有趣:
I. 新VR硬件: Byond 2
这几年最让我印象深刻的 VR 设备,解决了很多痛点,比如面部光密封问题,眼轴距问题,还有大小和重量问题,重量只有107克,比 Apple Vision Pro 的600克要轻非常多,大小更是要小近一半,更适合长时间佩戴游玩,而且还提供了116度的视角!
售价1019美元起,4月发货
这几年最让我印象深刻的 VR 设备,解决了很多痛点,比如面部光密封问题,眼轴距问题,还有大小和重量问题,重量只有107克,比 Apple Vision Pro 的600克要轻非常多,大小更是要小近一半,更适合长时间佩戴游玩,而且还提供了116度的视角!
售价1019美元起,4月发货
4 工具:
3 文章:
II. 将行为不端的机器人困在人工智能迷宫中
Cloudflare 推出 AI Labyrinth,这是一种利用 AI 生成内容来迷惑和拖慢不遵守“robots.txt”指令的 AI 爬虫。它通过创建一系列看似真实但无关紧要的页面来浪费爬虫的资源,同时作为下一代蜜罐来识别和记录恶意行为者
Cloudflare 推出 AI Labyrinth,这是一种利用 AI 生成内容来迷惑和拖慢不遵守“robots.txt”指令的 AI 爬虫。它通过创建一系列看似真实但无关紧要的页面来浪费爬虫的资源,同时作为下一代蜜罐来识别和记录恶意行为者
2 资源:
1 订阅:
以上就是本期的全部内容啦! 感谢阅读
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----
如果您喜欢本周刊, 可以通过以下方式来支持它:
本周刊采用 CC BY-SA 4.0 许可协议进行许可。
我的观点仅代表我个人,与任何附属机构无关。内容无恶意、无广告,均由我主观决定发布。为尊重您的隐私,不进行任何跟踪。
我的观点仅代表我个人,与任何附属机构无关。内容无恶意、无广告,均由我主观决定发布。为尊重您的隐私,不进行任何跟踪。
第115期 |
2025-03-29 |
2025-03-29 (每周六发布)
5 有趣:
I. ARC Prize 基金会启动 ARC-AGI-2 基准
其目标是那些对 AI 来说仍然困难,而对人类来说却很容易的技能,其任务至少需要两名人类在两次尝试之内才能完成。OpenAI 的 o3-low 在该版本中只有约 4% 的得分率,而在上一版本的得分率为 75.7%。
其目标是那些对 AI 来说仍然困难,而对人类来说却很容易的技能,其任务至少需要两名人类在两次尝试之内才能完成。OpenAI 的 o3-low 在该版本中只有约 4% 的得分率,而在上一版本的得分率为 75.7%。
II. Google 推出 Gemini 2.5 模型
这是谷歌一个思维模型,且首次登顶 LMArena 基准测试,提供了 100 万 token 的上下文,并且将会很快提升到 200 万个。该模型目前对高级订阅用户开放,API 将在几周内提供服务
这是谷歌一个思维模型,且首次登顶 LMArena 基准测试,提供了 100 万 token 的上下文,并且将会很快提升到 200 万个。该模型目前对高级订阅用户开放,API 将在几周内提供服务
IV. GPT-4o 现支持图片生成
该功能目前已上线 ChatGPT,非常擅长准确呈现文本内容,还可按要求修改上传的图片,同时还支持上下文的图片,整体体验非常不错。
V. OpenAI Agents SDK 支持 MCP 协议
OpenAI 的 Agents SDK 现已支持 MCP,使开发人员能够使用各种 MCP 服务器为 Agents 提供工具。该公司仍在努力为 OpenAI API 和 ChatGPT 桌面应用程序提供 MCP 支持
该功能目前已上线 ChatGPT,非常擅长准确呈现文本内容,还可按要求修改上传的图片,同时还支持上下文的图片,整体体验非常不错。
V. OpenAI Agents SDK 支持 MCP 协议
OpenAI 的 Agents SDK 现已支持 MCP,使开发人员能够使用各种 MCP 服务器为 Agents 提供工具。该公司仍在努力为 OpenAI API 和 ChatGPT 桌面应用程序提供 MCP 支持
4 工具:
I. Yaak
一款桌面 API 客户端,用于与 REST、GraphQL、Server Sent Events (SSE)、WebSocket 和 gRPC API 交互。它使用 Tauri、Rust 和 ReactJS 构建
一款桌面 API 客户端,用于与 REST、GraphQL、Server Sent Events (SSE)、WebSocket 和 gRPC API 交互。它使用 Tauri、Rust 和 ReactJS 构建
II. Reve Image
文本到图像生成工具,使用自有的模型,该模型在人工分析的图像竞技场中排名第一,超过了谷歌的 Imagen 3、Midjourney v6.1 和 Recraft V3 等竞争对手,目前提供免费试用
文本到图像生成工具,使用自有的模型,该模型在人工分析的图像竞技场中排名第一,超过了谷歌的 Imagen 3、Midjourney v6.1 和 Recraft V3 等竞争对手,目前提供免费试用
3 文章:
I. 人工智能对编程工作的影响
人工智能将创造出更多更多的程序员,新的编程工作也将面目全非。
文章提出了一个非常有意思的观点:人工智能并不会取代程序员,它只是提供了一个新的抽象层,就像从打卡员到汇编再到面向过、面向对象一样,也会产生新的编程方式和职位。
II. 自己动手建造
代码的目标应该是以无需更新的方式编写,它最终应该达到某种程度的稳定性。
作者认为,编写代码应该以减少依赖性为目标,这样就不需要等待上层作者修复代码,在 AI 时代,所有组件都自己编写将成为可能,并不会像以前那样浪费太多时间。
赞美那些因为一次就完成得很好,所以多年都不需要修改的代码。我们需要这种氛围的转变
III. 未来是更多的东西
当前的技术创新更多是围绕制造“稍好一些”的东西,却未能解决根本性问题,这导致人类陷入消费主义循环,忽视了真正改善生活质量和应对全球挑战的需求,总是把新误认为更好,把积累误认为进步。
当前的技术创新更多是围绕制造“稍好一些”的东西,却未能解决根本性问题,这导致人类陷入消费主义循环,忽视了真正改善生活质量和应对全球挑战的需求,总是把新误认为更好,把积累误认为进步。
新技术创造了效率,理论上应该减少工作。相反,资本主义却将这种效率转化为生产和消费的增长,创造了以制造、营销、销售和服务更多产品为中心的新工作。
多工作才能买更多的东西,而这些东西比以往更快磨损或过时,因此需要更多的工作才能买更多的东西
当利益驱动创新时,我们得到的是更有利可图的东西,而不是解决方案。
2 资源:
1 订阅:
I. Arun Venkatesan | [rss]
博主是一名产品设计师、工程师、摄影师和作家。博客主要探讨设计和技术如何塑造我们的生活。常见的主题包括工业设计、设计史、技术趋势、旅行照片以及创作和生活指南
-----
博主是一名产品设计师、工程师、摄影师和作家。博客主要探讨设计和技术如何塑造我们的生活。常见的主题包括工业设计、设计史、技术趋势、旅行照片以及创作和生活指南
-----
以上就是本期的全部内容啦! 感谢阅读
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----
如果您喜欢本周刊, 可以通过以下方式来支持它:
本周刊采用 CC BY-SA 4.0 许可协议进行许可。
我的观点仅代表我个人,与任何附属机构无关。内容无恶意、无广告,均由我主观决定发布。为尊重您的隐私,不进行任何跟踪。
我的观点仅代表我个人,与任何附属机构无关。内容无恶意、无广告,均由我主观决定发布。为尊重您的隐私,不进行任何跟踪。
第114期 |
2025-03-22 |
2025-03-22 (每周六发布)
5 有趣:
- 新 GPU 阵容包括 2025 年底推出的 Blackwell Ultra、2026 年推出的 Vera Rubin 和 2028 年推出的 Feynman,每款 GPU 都有望大幅提升性能
- 首个开放的仿人机器人基础模型 Isaac GR00T N1,以及用于训练机器人的综合物理人工智能数据集
- 与谷歌 DeepMind 和迪斯尼合作的机器人物理引擎牛顿也首次亮相,非常可爱的星球大战风格的机器人 Blue 登台亮相
- 全新的 DGX Spark 和 DGX Station 为个人工作站带来了数据中心级的人工智能计算,黄称其为 "人工智能时代的个人超级计算机"
- Nvidia 还宣布与汽车制造商通用汽车(GM)建立新的合作伙伴关系,计划为该公司打造首支自动驾驶汽车车队。
II. TxAgent 代理
哈佛大学和麻省理工学院的研究人员发布了 TxAgent,它是一个人工智能代理,利用多步推理和实时生物医学知识检索为患者生成可信的个性化治疗建议,可为医生提供更安全、更有针对性的治疗。
哈佛大学和麻省理工学院的研究人员发布了 TxAgent,它是一个人工智能代理,利用多步推理和实时生物医学知识检索为患者生成可信的个性化治疗建议,可为医生提供更安全、更有针对性的治疗。
III. Google Gemini 更新
- 推出个性化功能: 可自动将你的搜索历史和聊天内容添加到上下文,同时还可以添加需记忆的内容以便后续使用
- 添加 Canvas 互动空间: 可用于完善文档和代码,并实时显示更改内容,类似 Claude Artifacts,同时还集成了 NotebookLM
IV. 值得关注的 LLM 小模型
- Phi-4: 微软在2月26号发布 Phi-4-multimodal 多模态语言模型,5.6B 参数,128k 上下文,能够同时处理语音、视觉和文本,非常适合部署在移动设备或者低性能的设备上
- Mistral Small 3.1: 多模态语言模型,24B 参数,128k 上下文
- Command A: 111B 参数,256k 上下文
V. 可弯曲传播的声音
研究人员发明了自弯曲超声波束,可将声音绕过障碍物,在特定的目标位置汇合,类似光学透镜弯曲光线的原理。
其潜在的应用非常广泛,比如在公共场所不用带耳机即可提供个性化的音频;图书馆可以让学生在不打扰他人的情况下通过语音课程学习;在汽车中,乘客可以听音乐,而不会分散驾驶员听导航指示的注意力;办公室和军事环境也可以受益于用于保密对话的局部语音区;还可用于消除指定区域的噪音,创建安静区域以提高工作场所的注意力或减少城市噪音污染
4 工具:
I. LiveKit
一个面向开发人员构建实时媒体应用的开源平台。它可以轻松集成音频、视频、文本、数据和人工智能模型,同时提供基于 WebRTC 的可扩展实时基础设施。OpenAI 的实时语音对话就是使用的该平台在 LLMs 和用户之间传输音频数据
一个面向开发人员构建实时媒体应用的开源平台。它可以轻松集成音频、视频、文本、数据和人工智能模型,同时提供基于 WebRTC 的可扩展实时基础设施。OpenAI 的实时语音对话就是使用的该平台在 LLMs 和用户之间传输音频数据
3 文章:
III. 为什么你几乎做什么都会失败?
如果你想了解为什么大多数人都一事无成,那么这篇文章值得你看看,至少我中枪了。
如果你想了解为什么大多数人都一事无成,那么这篇文章值得你看看,至少我中枪了。
当他们遇到创业、结识新朋友或改变整个生活的机会时,他们的潜意识反应是:听起来像是骗局,我不能这么做,因为...,但如果不起作用呢?
你放弃得太早了,你没有学会如何将失败视为通往成功的唯一途径。
2 资源:
1 订阅:
当我把计划从 "赚大钱和捐款 "转为 "建造重要的东西 "时,有一件事让我很吃惊,那就是我的工作效率提高了很多。
我想,如果我是通过从事智力上有趣的工作来赚取美元,我就会保持动力。结果发现并非如此
-----
以上就是本期的全部内容啦! 感谢阅读
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----
如果您喜欢本周刊, 可以通过以下方式来支持它:
本周刊采用 CC BY-SA 4.0 许可协议进行许可。
我的观点仅代表我个人,与任何附属机构无关。内容无恶意、无广告,均由我主观决定发布。为尊重您的隐私,不进行任何跟踪。
我的观点仅代表我个人,与任何附属机构无关。内容无恶意、无广告,均由我主观决定发布。为尊重您的隐私,不进行任何跟踪。
第113期 |
2025-03-15 |
2025-03-15 (每周六发布)
5 有趣:
I. 微软正在使用 Go 语言开发 TypeScript 编译器和工具链的原生版本
微软正在开发 TypeScript 的原生版本(TypeScript 7.0),该版本将大幅提升性能,包括将构建时间减少10倍、降低内存使用量,并计划在2025年中期推出命令行类型检查功能,年底前完成项目构建和语言服务的完整实现(repo)
微软正在开发 TypeScript 的原生版本(TypeScript 7.0),该版本将大幅提升性能,包括将构建时间减少10倍、降低内存使用量,并计划在2025年中期推出命令行类型检查功能,年底前完成项目构建和语言服务的完整实现(repo)
II. Google Gemini 相关更新
- Gemini 2.0 Flash 上线原生图像生成功能: 擅长保持角色和场景一致性、通过对话编辑图像以及准确渲染文本。(在线 Chat )
- Gemini Robotics: 谷宣布成立 Gemini Robotics 公司,旨在打造通用机器人,还发布了 Gemini Robotics-ER 视觉语言模型,该模型具有增强的空间能力,侧重于空间推理,可帮助机器人在无需训练的情况下完成现实世界中的任务。
III. OpenAI 推出代理套件
添加了新的 responses API 接口,可提供网络搜索、文件扫描和计算机使用三个功能,同时还提供了代理 SDK 以便协调单个/多个代理系统,并提供了安全防护和监控功能。
添加了新的 responses API 接口,可提供网络搜索、文件扫描和计算机使用三个功能,同时还提供了代理 SDK 以便协调单个/多个代理系统,并提供了安全防护和监控功能。
IV. 从零开始打造一款(T1D)智能手表
作者的 9 岁儿子患有1型糖尿病下(T1D),为此他制作了一款智能手表,除了基本的防水功能外,还需提供可靠的 CGM 数据,并在血糖水平过低或过高时提供紧急触觉反馈。整个制作过程非常有趣且酷
V. Ink & Switch
一个很有意思的研究实验室,主要探索人类未来思想的工具,愿景是帮助人类更清晰地思考,更有效地协作,目前有3个研究方向:可塑软件、可编程墨水、本地优先协作。
该实验室还有很多相关的实验软件/文章,都非常有意思,建议去玩一玩。
作者的 9 岁儿子患有1型糖尿病下(T1D),为此他制作了一款智能手表,除了基本的防水功能外,还需提供可靠的 CGM 数据,并在血糖水平过低或过高时提供紧急触觉反馈。整个制作过程非常有趣且酷
V. Ink & Switch
一个很有意思的研究实验室,主要探索人类未来思想的工具,愿景是帮助人类更清晰地思考,更有效地协作,目前有3个研究方向:可塑软件、可编程墨水、本地优先协作。
该实验室还有很多相关的实验软件/文章,都非常有意思,建议去玩一玩。
4 工具:
3 文章:
III. 检测推理模型中的作弊行为
来自 OpenAI 的研究报告,他们发现大型语言模型可以通过监控其思维链来检测利用漏洞的行为,但对其思维链的过度监测可能会导致模型隐藏其真实意图。
类似“双缝干涉实验”,反映了观测对系统行为的深刻影响,以及系统在面对监控时可能采取的适应或伪装策略。
更深入的讨论,可查看 Less Wrong 的相关分析: The Most Forbidden Technique
来自 OpenAI 的研究报告,他们发现大型语言模型可以通过监控其思维链来检测利用漏洞的行为,但对其思维链的过度监测可能会导致模型隐藏其真实意图。
类似“双缝干涉实验”,反映了观测对系统行为的深刻影响,以及系统在面对监控时可能采取的适应或伪装策略。
更深入的讨论,可查看 Less Wrong 的相关分析: The Most Forbidden Technique
2 资源:
1 订阅:
以上就是本期的全部内容啦! 感谢阅读
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----
最后,请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----
如果您喜欢本周刊, 可以通过以下方式来支持它:
本周刊采用 CC BY-SA 4.0 许可协议进行许可。
我的观点仅代表我个人,与任何附属机构无关。内容无恶意、无广告,均由我主观决定发布。为尊重您的隐私,不进行任何跟踪。
我的观点仅代表我个人,与任何附属机构无关。内容无恶意、无广告,均由我主观决定发布。为尊重您的隐私,不进行任何跟踪。