54321 Weekly

第122期

2025-05-24

2025-05-24 (每周六发布)

我是Versun, 这里是54321周刊.
查看过往内容: 54321.versun.me

【因个人精力有限，本周刊暂停】
【后续将会专注于博客内容上，博客也提供了邮件和RSS订阅】
【感谢大家的陪伴。】
【详情见博文，后会有期！】

5 有趣:

I. 2025 Vibe Coding Game Jam
一个很有意思的 Game Jam，规则是游戏至少80%的代码由 AI 完成，目前该 Jam 已结束，但可以去玩一玩排名前几的游戏

II. Google I/O 2025大会
发布Gemini 2.5 Pro深度思考模式、Veo 3视频模型、Imagen 4图片模型、Flow视频创作工具、Chrome 内置 Gemini、NotebookLM将支持视频摘要、Gemini App Live模式支持摄像头实时拍摄聊天

III. Anthoropic 发布 Claude 4 模型
分别是Claude Opus 4 和 Claude Sonnet 4，两个模型都提供了推理模式

IV. OpenAI 推出 Codex
这是一个软件工程 Agent，可以并行处理多个不同的编码任务，比如编写功能、回答 issue、修复 bug 等。后端了使用了特调的 o3 模型 codex-1，整体体验类似 Claude Code，但是在云端沙盒中进行，并不是本地电脑。

V. F1 at 75
以精美的图片和文字概述了 F1 赛车的历史，很有意思。

4 工具:

I. NLWeb
微软本周发布的协议 Natural Language Web，旨在轻松地将任何网站转化为人工智能驱动的应用程序，让用户可以直接使用自然语言查询网站内容；每个 NLWeb 实例也是一个 MCP 服务器，MCP 之于 NLWeb 就如同 HTTP 之于 HTML

II. crosspost
可同时交叉发布内容到多个社交平台的 js 库

III. Colanode
开源可自部署的 Slack 和 Notion 替代品

IV. Typst
专注于论文写作的工具，可以更方便的处理排版和格式，以及 LaTeX 数学公式，同时还支持协调编辑。

3 文章:

I. 知道如何做的诅咒，或；解决一切问题

有时我们就是通过创造来自我安慰的。我们写一个新工具，是因为我们急需一个小小的胜利。我们编写新工具，是因为我们不堪重负。重构它，不是因为代码凌乱，而是你的生活凌乱。
编程能给你即时反馈。你运行它，它就能工作。或者它不行，你就去修正它。无论如何，你都做了一些事情

II. MCP：值得关注的协议（即使您还不确定该如何使用它）
非常同意作者的观点，目前 MCP 做为 AI 代理的 HTTP 协议，缺少了很多安全方面的考量，但正如 HTTPS 一样，MCP 将来也必定需要新的协议来补足安全模块，正如作者所描述的：

MCP 并不能解决这些问题，它只是让这些问题有可能通过正确的架构来解决，我们应该注意不要将结构与安全性混为一谈，它只是意味着它在按部就班地工作

III. LLM 记忆 --- LLM Memory
本文深入探讨了从参考框架、向量嵌入到知识图谱等多种 LLM 记忆机制，带你一窥构建更强大机器记忆的可能路径

2 资源:

I. xai-org/grok-prompts
X/Twitter上Grok 聊天助手和 `@grok` 机器人的提示词

II. PulseMCP
MCP资源站，收集了MCP Server、Client、文章和用例，类似的还有 MCP.so

1 订阅:

I. Working Theorys | [rss]
这是一份关于人文和技术的时事通讯，作者对现代工作、生活的理论和框架很独特。

-----

以上就是本期的全部内容啦! 感谢阅读
最后，请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----

如果您喜欢本周刊, 可以通过以下方式来支持它:

成为第17位赞助者
发邮件打个招呼吧
分享到 Twitter

周刊订阅方式：邮件或 RSS
-----

本周刊采用 CC BY-SA 4.0 许可协议进行许可。
我的观点仅代表我个人，与任何附属机构无关。内容无恶意、无广告，均由我主观决定发布。为尊重您的隐私，不进行任何跟踪。

第121期

2025-05-17

2025-05-17 (每周六发布)

我是Versun, 这里是54321周刊.
查看过往内容: 54321.versun.me

5 有趣:

I. F1赛车车手驾驶全尺寸乐高F1赛车驰骋赛道
乐高耗时8个月打造了20辆完整的1:1比例的 F1 赛车，并在迈阿密大奖赛的车手巡游中，由车手驾驶这些乐高赛车在赛道上巡游，非常震撼

II. Mentra 智能眼镜
一款开源的智能眼镜，可以使用 AugmentOS SDK 进行开发构建应用，硬件售价219美元起

III. Stripe 推出稳定币 USDC 和 USDB 账户
在完成对稳定币平台 Bridge 的收购后，Stripe 推出了稳定币金融账户，将向 101 个国家的企业开放，资金可通过ACH、电汇或加密钱包转入，也可转账到银行账户或加密地址，后续还会提供支持稳定币计价的Visa卡服务

IV. Sakana 推出新的神经网络架构 CTM (Continuous Thought Machine)
这是一种模拟神经活动时间演化的新方法，传统的神经网络(NN)的灵感最初来源于生物大脑，但有意抽象掉这种时间动态，以便促进大规模深度学习。但 Sakana 认为时间应该是人工智能的核心组成部分，这样人工智能才能最终达到与人类大脑相媲美或超越人类大脑的能力水平。

V. Mass General Brigham 的研究人员推出了 FaceAge
这是一种人工智能工具，只需通过分析人的面部照片，就能估算出人的生理年龄，目的是改善癌症存活率预测。(repo)

4 工具:

I. oapi-codegen
一个命令行工具库，用于将 OpenAPI 规范转换为 Go 代码，无论是服务器端实现、API 客户端，还是简单的 HTTP 模型

II. deer-flow
来自字节跳动的开源深度研究工具

III. Starguard
这是一个命令行工具，可检测给定的 Github Repo 是否存在假冒star活动、依赖劫持、licence red-flags 和其他风险迹象，可实施自动化的开源尽职调查

IV. Computer Agent
Hugging Face 推出的的计算机使用代理

3 文章:

I. 超类型
超类型（Hyper-typing）是一种将类型复杂到几乎无法使用的行为，它正在成为 TypeScript 生态系统中的一种趋势。虽然更严格的类型更安全，但往往也更复杂，编译错误产生的是一堵难以理解的文字墙。作者认为使用不那么 "完美"的库，但更简单的类型，甚至类型生成，往往会带来更实用、更愉快的开发体验。

II. 独立开发者或将拯救电子游戏产业
探讨了在主流游戏产业面临高成本与创新瓶颈的困境下，独立开发者如何凭借其创造力、灵活性以及对游戏艺术的执着追求，不仅打造出备受赞誉的佳作，更可能为整个行业注入新的活力并指明未来方向。

III. Ask HN：你是如何获得第一百个用户的？
挺有意思的一个讨论贴，主要讨论“如何获取用户”主题

2 资源:

I. Awesome Mac 应用分享
收集了各种类别非常好用的 Mac 应用程序、软件以及工具，数据非常全！

II. Basecoat
shadcn/ui 无 React 的版本，洁癖者的福音啊

1 订阅:

I. Techno Sapiens | [rss]
这是一份由育儿教授 Jacqueline Nesi 经营的 Newsletter，主要内容是关于儿童的屏幕时间和心理健康，以及父母如何帮助孩子驾驭技术和社交媒体的内容

-----

以上就是本期的全部内容啦! 感谢阅读
最后，请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----

如果您喜欢本周刊, 可以通过以下方式来支持它:

成为第17位赞助者
发邮件打个招呼吧
分享到 Twitter

周刊订阅方式：邮件或 RSS
-----

第120期

2025-05-10

2025-05-10 (每周六发布)

我是Versun, 这里是54321周刊.
查看过往内容: 54321.versun.me

5 有趣:

I. Nvidia 发布了 Parakeet V2 语音识别 (ASR) 模型
该模型仅 0.6B 大小，可在一秒钟内转录一小时的音频，同时达到商业级的准确度水平，同时还拥有时间戳、自动标点和大小写、歌词转录等功能，但仅支持英语。

II. OpenAI 将以 30 亿美元的价格收购编码平台 Windsurf
这笔交易将是 OpenAI 迄今为止最大的一笔收购，将补充 ChatGPT 的编码能力

III. 谷歌推出 Gemini 2.5 Pro 预览版模型
本次更新具有更强大的编码功能，主要集中在前端和 UI 开发。该模型还拥有视频理解能力。在 WebDev Arena 和 Chatbot Arena 排行榜上位列第一。

IV. 微软推出新 Surface Pro 便携式电脑
分12和13英寸两个版本，均使用了高通的 Arm 架构 CPU ，还搭载了高通的 GPU 和 NPU，可实现离线运行 AI 功能。12英寸版本将在今年7月上架，13英寸版本起售价7488元

V. NotebookLM支持生成 50 种不同语言的播客
NotebookLM 现支持多达50种语言的播客了，包括中文（原来只支持英文）

4 工具:

I. Tailchat
开源可自部署的类 Discord 平台，添加了 AI、插件、机器人等功能

II. Bruno
一款可以替代 postman 的集成 Git、完全离线的开源 API 客户端

III. DeepWiki
最近超级火的一个工具，可以为任意 Github Repo 自动创建详细的架构图和文档，非常适合生乳研究代码或者重构代码

IV. Railpack
一款只需极少配置即可从源代码自动构建镜像的工具

3 文章:

I. 构建可靠的 LLM 应用程序的12个原则
利用这12条核心的工程技术原则，构建更加可靠、可扩展和易于维护的 LLM 应用程序

II. 学会爱护你的遗留代码库

当你放弃旧系统、建立新系统时，你必须知道未来会有哪些挑战，您很有可能刚刚创建了下一代遗留代码，而未来的开发人员将在今后的岁月中鄙视这些代码。
在决定扔掉旧代码之前，花点时间多了解一下它，也许你会对代码和最初构建它的人产生新的敬意

III. Copilot 询问、编辑和代理模式：它们的作用和使用时机
来自 Github 官方的博文，详细介绍了 Copilot 的不同模式的区别和使用时机，也适合 Cursor、Windsurf 等工具。

2 资源:

I. 吉卜力工作室电影高清图片
吉卜力工作室上传了其几乎所有电影的数百张高分辨率静态图片，这些图片被标注为 "仅供个人影迷使用，以进一步欣赏吉卜力工作室的电影"，并呼吁人们 "请在常识范围内自由使用这些图片"

II. Kira
提供个性化教育的人工智能平台，主要针对 K-12 阶段，是一套完整的人工智能教学解决方案，目前需发送邮件申请使用。

1 订阅:

I. Freethink | [rss]
这是一家专注于科技、商业与社会的新闻媒体，主打前沿科技、重大趋势和思想领袖专访，帮助热衷进步与创新的读者洞察未来。

-----

以上就是本期的全部内容啦! 感谢阅读
最后，请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----

如果您喜欢本周刊, 可以通过以下方式来支持它:

成为第14位赞助者
发邮件打个招呼吧
分享到 Twitter

周刊订阅方式：邮件或 RSS
-----

第119期

2025-04-26

2025-04-26 (每周六发布)

我是Versun, 这里是54321周刊.
查看过往内容: 54321.versun.me
【下周五一节暂停一期，提前预祝大家五一快乐！】

5 有趣:

I. Perplexity 发布 iOS 语音助手
该助手允许用户使用语音命令在移动设备上执行代理操作、访问网页、创建邮件等，比 Siri 要聪明好用。

II. Hyperwood
这是一个用简单的木条制作家具的开源系统，旨在让任何人都能使用最少的工具和材料，制造美观、坚固的家具，很有意思的一个网站，

III. Breakout 黑客马拉松
很有意思的一个黑客马拉松，除了基本奖项外，还新推出"退学计划"，专为准备全心投入的创始人，并愿意退学全职从事加密行业，那么有机会获得25万美金的启动资金。

IV. 2025: 前沿企业诞生之年
微软发布的工作趋势指数报告，描绘了以人工智能为中心、由人类主导的 "前沿企业 "的崛起，新模式将重塑工作场所，未来的工作将由人工智能代理主导，但由人类进行管理。我们正处于工作方式全面转变的初期阶段--人类-代理团队将成为常态，公司将转向完全混合的、人工智能注入的结构；非常建议细读该报告，干货很多

V. 让人工智能生成的代码在任何语言中都更准确
麻省理工学院发表了一种 "顺序蒙特卡洛 "方法，可高效生成人工智能代码，通过将精力分配到最有可能有效和准确的输出上，同时在流程的早期阶段放弃不理想的输出，使小型模型的性能优于大型模型

4 工具:

I. Together Fine-Tuning
来自 Together.ai 的模型微调平台，易用且文档清晰，非常建议学习使用

II. flowith
一个 AI 生产力工具，不同于传统聊天式 AI 工具，flowith 基于二维画布的交互可以让你在一个画布中与多个 AI 模型同时交互，并进行内容生成。还有 Oracle Agent 系统，交互很强大，值得一试

III. Firecrawl
可以将任意网站转为适配 LLM 使用的文本文件

IV. mcp-containers
提供了数百个 MCP 服务器的容器化版本

3 文章:

I. 我在 Figma 10 年中学到的 10 件事
Claire Butler 于 2015 年加入 Figma，成为公司招聘的第一位营销人员和业务人员，她在10年后做出了离开的决定，并写出了这篇经验分享

II. Vibe Coding 不是低质量工作的借口
介绍了在使用编程助理进行 Vibe Coding 时的使用指南和注意事项。

最大的启示是，没有质量，速度毫无意义。更快地发布漏洞百出、不可维护的代码是一种虚假的胜利--你只是在加速冲向悬崖

III. 我应该在 GitHub Copilot 中使用哪种人工智能模型
来自 Github 官方的编程模型选择指南，不仅适用于 Copilot，也适用于其它编程助理工具，比如 Cursor 和 Windsurf

2 资源:

I. Claude Code 最佳实践指南
Anthropic 发布了该指南，提供了使用 Claude Code 的详细技巧和优化流程

II. Open Props UI
一个纯 CSS 实现的 UI 库，以易用性和可扩展性为前提

1 订阅:

I. ByteByteGo | [rss]
这是关于软件构建、系统设计的 Newsletter，每期都非常干货。

-----

以上就是本期的全部内容啦! 感谢阅读
最后，请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----

如果您喜欢本周刊, 可以通过以下方式来支持它:

成为第14位赞助者
发邮件打个招呼吧
分享到 Twitter

周刊订阅方式：邮件或 RSS
-----

第118期

2025-04-19

2025-04-19 (每周六发布)

我是Versun, 这里是54321周刊.
查看过往内容: 54321.versun.me

5 有趣:

I. 谷歌发布 A2A 开放式协议
该协议更相比 MCP 更靠近用户，是一个应用级协议，主要用于不同代理间的连接。

II. Grok 3现支持 API 调用
共2个模型可用：Grok 3 和 Grok 3 Mini(with Thinking)，同时提供了加价的快速模式，可以提高响应速度

III. 研究人员测试了主流的 AI 模型在《王牌检察官》游戏中的表现
这是一款玩家必须调查犯罪现场并破案的热门游戏，人工智能在游戏中扮演侦探，收集线索，揭露矛盾，揭开真相。
测试结果：O1 和 Gemini 2.5 Pro 表现最好，新的 GPT-4.1 与几个月前的 Claude 3.5 Sonnet 表现一致。

IV. 谷歌利用 Pixel 手机和人工智能与海豚对话
谷歌训练了一个 AI 模型: DolphinGemma，并部署在 Pixel 手机上以帮助研究人员尝试理解海豚的语言，甚至进行对话，挺有意思的

V. 英伟达终于为 CUDA 添加了原生 Python 支持
允许开发人员编写可直接在 GPU 上运行的 Python 代码，而无需依赖 C 或 C++ 中间件

4 工具:

I. datastar
新的前端框架，只有14.5 KB，提供了类似 Alpine.js 和 htmx 的功能

II. mcp-shield
MCP 服务器的安全扫描仪工具，类似的还有 mcp-scan

III. gh-signoff
来自 Basecamp 最近刚开源的一款工具，用于本地 CI 的 GitHub 命令行扩展。如今，开发人员的机器速度超快，但利用率却长期不足，而云 CI 服务通常又慢又贵，还是租用的，所以该工具能让开发人员在自己的机器上运行 CI，并在通过后签字确认。

IV. dockerpyze
可自动为你的 Python 项目生成 docker 映像

3 文章:

I. 《过河卒》: 比特币雏形之父之父的故事
这篇博文回顾了戴习为（《过河卒》作者）历经波折最终在美国科技界取得成功的生平，并探讨了坚持不懈、终身学习、家庭环境以及“日拱一卒”式自我超越的重要性，有一定的启发和鼓舞

II. AppStore 首页推荐后，依然月入不足 3000，独立开发两年血泪复盘
这是一位全职独立开发者的复盘，干货很多。

III. 如何找到你的兴趣
这是本人写得一篇博文，说来惭愧，对于兴趣，本人虽已三十出头，但依旧还在探索的路上，但一路走来依旧有些许经验，故分享，希望能启发更多人。

2 资源:

I. Brains On!
American Public Media 为儿童和好奇的成年人制作的科学播客，我主要用来英语听力学习，很有趣

II. MCP 安全检查清单：AI 工具生态系统安全指南
来自慢雾科技的MCP安全指南

1 订阅:

I. The Noah Kalina Newsletter
一位居住在纽约兰伯兰的艺术家和摄影师，在这份时事通讯中，你会看到有关他的摄影项目相关的故事、幕后花絮、观察、探险。没有严格的主题，只有图片和想法的组合，他看待事物的角度很细微且很独特。

-----

以上就是本期的全部内容啦! 感谢阅读
最后，请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----

如果您喜欢本周刊, 可以通过以下方式来支持它:

成为第14位赞助者
发邮件打个招呼吧
分享到 Twitter

周刊订阅方式：邮件或 RSS
-----

第117期

2025-04-12

2025-04-12 (每周六发布)

我是Versun, 这里是54321周刊.
查看过往内容: 54321.versun.me

5 有趣:

I. Anthropic 相关更新
- Anthropic 推出教育版 Claude: 教育版添加了学习模式，引导学生推理过程，而不是提供答案。同时还会提供学生计划。
- 添加 Max 付费计划: $100/月起，比 Pro 版多5~20倍的使用量

II. NVIDIA 发布 Nemotron-Ultra 模型
它是 Meta Llama-3.1-405B-Instruct 的衍生模型，拥有 253B 参数的开源推理模型，支持 128K 标记的上下文长度，在关键基准测试中超越 DeepSeek R1 和 Llama 4 Behemoth

III. 台积电推出了 2 纳米芯片
台积电于 4 月 1 日推出了 2 纳米芯片，预计将于今年下半年量产，与 3 纳米芯片相比，在相同的功率水平下，它们的计算速度提高了 10%至 15%，或在相同的速度下，功耗降低了 20%至 30%，晶体管密度提高了约 15%

IV. Windsurf Wave 7
在这次更新中，Windsurf 将 Cascade 的功能通过插件的形式带进了 JetBrains IDE

V. 2025 年人工智能指数报告
斯坦福大学发布的最新报告，使用12个图表说明了当前人工智能发展的情况。同时还提供了近400页的报告详情

4 工具:

I. augment code
一款新的 AI 编码助手，以插件形式支持主流的 IDE，目前在 SWE-bench 上排行第一，30美金/月不限量

II. git-mcp
可将任何 GitHub 仓库无缝转换为 MCP 服务，以便 AI 能够访问和理解仓库代码/文档

III. Sparks
一种无需代码即可在文本中创建迷你图的字体，非常方便

IV. Glamorous Toolkit
一个很特别的 IDE，官方称其为“可塑性开发环境(MDE)”，它是一种通过自定义工具进行编程的方式，不仅提供了代码操作的基础设施，还能随着你的输入改变其形态，通过创建专门的微型工具来使系统变得可解释，重塑了整个开发体验

3 文章:

I. Git 20 周年：与 Linus Torvalds 的问答
Git 诞生20周年了，该文是 Github 与 Linus Torvalds 的采访稿

II. 使用 AI 的能力将成为 Shopify 的基本要求
来自 Shopify CEO 的一篇内部备忘录，其中明确了在公司内使用 AI 的具体要求：

项目原型阶段必须使用 AI
绩效评估加入AI使用能力
资源申请前需证明AI无法解决

III. 贸易、关税和技术
深度解析了最近特朗普关税政策如何重塑全球科技格局，以及贸易战背后的战略博弈与科技行业未来走向

2 资源:

I. 健康行动指南
深度总结Huberman Lab与Peter Attia播客精华，转化为实用的健康行动指南

II. Awesome MCP Servers
收集了很多可用的 MCP 服务器列表

1 订阅:

I. IEEE Spectrum | [rss]
这是 IEEE 的旗舰杂志和网站，提供了关于技术、工程和科学领域的主要趋势和最新发展

-----

以上就是本期的全部内容啦! 感谢阅读
最后，请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----

如果您喜欢本周刊, 可以通过以下方式来支持它:

成为第12位赞助者
发邮件打个招呼吧
分享到 Twitter

周刊订阅方式：邮件或 RSS
-----

第116期

2025-04-05

2025-04-05 (每周六发布)

我是Versun, 这里是54321周刊.
查看过往内容: 54321.versun.me

5 有趣:

I. 新VR硬件: Byond 2
这几年最让我印象深刻的 VR 设备，解决了很多痛点，比如面部光密封问题，眼轴距问题，还有大小和重量问题，重量只有107克，比 Apple Vision Pro 的600克要轻非常多，大小更是要小近一半，更适合长时间佩戴游玩，而且还提供了116度的视角！
售价1019美元起，4月发货

II. Gemini 2.5 Pro 实验版面向所有用户开放
目前该模型在 LMArena 排行榜上排名第一，个人测试效果非常好，超大的上下文很适合编码

III. Qwen 推出视觉推理模型: QVQ-Max
该模型不仅能够“看懂”图片和视频里的内容，还能结合这些信息进行分析、推理，甚至给出解决方案

IV. Ghost ActivityPub 开启公测
目前仅在 Ghost(Pro) 上公测，自建服务暂不支持

V. Yaydio: 专为儿童设计的便携式卡片音乐播放器
一款专为儿童设计的便携式音乐播放器，它摒弃了 CD 的繁琐，采用了易于使用的NFC卡，非常有创意。
作者

4 工具:

I. xan
一个用 Rust 编写的命令行工具，可在 shell 中处理 CSV 文件

II. OpenAI.fm
玩转 OpenAI 语音功能的小工具

III. Cover Your Tracks
在线测试浏览器的指纹工具，了解自己所使用的浏览器的隐私保护情况

IV. Calligraphr
可以将您的手写体转为字体，非常有意思的工具

3 文章:

I. 前端跑步机
文章探讨了前端开发中频繁更换框架的现象，称之为“前端跑步机。作者建议减少复杂抽象，更多依赖核心Web技术，这不仅能降低技术债务，还能提高开发者的长期市场价值

II. 将行为不端的机器人困在人工智能迷宫中
Cloudflare 推出 AI Labyrinth，这是一种利用 AI 生成内容来迷惑和拖慢不遵守“robots.txt”指令的 AI 爬虫。它通过创建一系列看似真实但无关紧要的页面来浪费爬虫的资源，同时作为下一代蜜罐来识别和记录恶意行为者

III. 30 分钟内了解高能动性
介绍了一种以清晰思考、行动倾向和不随波逐流为核心的能力，强调主动改变现实、解决问题并塑造未来的心态。

2 资源:

I. 黑客法则
汇总了几乎所有开发相关的法则、理论、原则和模式。

II. Go 优化指南
在线电子书，旨在帮助开发人员编写更快、更高效的 Go 应用程序

1 订阅:

I. Stefan | [rss]
一位非常厉害的前端开发师，同时还维护一份前端周刊: Web Weekly

-----

以上就是本期的全部内容啦! 感谢阅读
最后，请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----

如果您喜欢本周刊, 可以通过以下方式来支持它:

成为第12位赞助者
发邮件打个招呼吧
分享到 Twitter

周刊订阅方式：邮件或 RSS
-----

第115期

2025-03-29

2025-03-29 (每周六发布)

我是Versun, 这里是54321周刊.
查看过往内容: 54321.versun.me

本位置已开设赞助广告位，有意者请查看具体详情

5 有趣:

I. ARC Prize 基金会启动 ARC-AGI-2 基准
其目标是那些对 AI 来说仍然困难，而对人类来说却很容易的技能，其任务至少需要两名人类在两次尝试之内才能完成。OpenAI 的 o3-low 在该版本中只有约 4% 的得分率，而在上一版本的得分率为 75.7%。

同时基金会还举办了一场 100 万美元的竞赛，以推动更高效的通用智能系统研究，开放时间为 3 月 26 日至 11 月 3 日。

II. Google 推出 Gemini 2.5 模型
这是谷歌一个思维模型，且首次登顶 LMArena 基准测试，提供了 100 万 token 的上下文，并且将会很快提升到 200 万个。该模型目前对高级订阅用户开放，API 将在几周内提供服务

III. Zapier MCP
继上次推出 Zapier Agent 后，这次的 MCP 服务，可以只使用一个 MCP 即可对接成千上万的第三方服务，为你的 AI 应用添双翅膀。

IV. GPT-4o 现支持图片生成
该功能目前已上线 ChatGPT，非常擅长准确呈现文本内容，还可按要求修改上传的图片，同时还支持上下文的图片，整体体验非常不错。

V. OpenAI Agents SDK 支持 MCP 协议
OpenAI 的 Agents SDK 现已支持 MCP，使开发人员能够使用各种 MCP 服务器为 Agents 提供工具。该公司仍在努力为 OpenAI API 和 ChatGPT 桌面应用程序提供 MCP 支持

4 工具:

I. Yaak
一款桌面 API 客户端，用于与 REST、GraphQL、Server Sent Events (SSE)、WebSocket 和 gRPC API 交互。它使用 Tauri、Rust 和 ReactJS 构建

II. Reve Image
文本到图像生成工具，使用自有的模型，该模型在人工分析的图像竞技场中排名第一，超过了谷歌的 Imagen 3、Midjourney v6.1 和 Recraft V3 等竞争对手，目前提供免费试用

III. mcp-agent
一个简单、可组合的框架，用于包含 MCP 的 AI 代理

IV. Second-Me
可以用该工具制作 AI 版本的自己

3 文章:

I. 人工智能对编程工作的影响

人工智能将创造出更多更多的程序员，新的编程工作也将面目全非。

文章提出了一个非常有意思的观点：人工智能并不会取代程序员，它只是提供了一个新的抽象层，就像从打卡员到汇编再到面向过、面向对象一样，也会产生新的编程方式和职位。

II. 自己动手建造

代码的目标应该是以无需更新的方式编写，它最终应该达到某种程度的稳定性。

作者认为，编写代码应该以减少依赖性为目标，这样就不需要等待上层作者修复代码，在 AI 时代，所有组件都自己编写将成为可能，并不会像以前那样浪费太多时间。

赞美那些因为一次就完成得很好，所以多年都不需要修改的代码。我们需要这种氛围的转变

III. 未来是更多的东西
当前的技术创新更多是围绕制造“稍好一些”的东西，却未能解决根本性问题，这导致人类陷入消费主义循环，忽视了真正改善生活质量和应对全球挑战的需求，总是把新误认为更好，把积累误认为进步。

新技术创造了效率，理论上应该减少工作。相反，资本主义却将这种效率转化为生产和消费的增长，创造了以制造、营销、销售和服务更多产品为中心的新工作。
多工作才能买更多的东西，而这些东西比以往更快磨损或过时，因此需要更多的工作才能买更多的东西
当利益驱动创新时，我们得到的是更有利可图的东西，而不是解决方案。

2 资源:

I. Experience CS
树莓派基金会推出的计算机科学免费综合课程，将计算机科学概念无缝融入数学、科学、语言和艺术等核心学科，使中小学教育工作者能够教授计算机科学，将在今年6月推出，值得期待！

II. Anthropic 研究
Anthropic 的研究成果，包含很多高质量的论文，比如3月27号发布的追踪大型语言模型的思路的论文就非常有意思

1 订阅:

I. Arun Venkatesan | [rss]
博主是一名产品设计师、工程师、摄影师和作家。博客主要探讨设计和技术如何塑造我们的生活。常见的主题包括工业设计、设计史、技术趋势、旅行照片以及创作和生活指南

-----

以上就是本期的全部内容啦! 感谢阅读
最后，请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----

如果您喜欢本周刊, 可以通过以下方式来支持它:

成为第12位赞助者
发邮件打个招呼吧
分享到 Twitter

周刊订阅方式：邮件或 RSS
-----

第114期

2025-03-22

2025-03-22 (每周六发布)

我是Versun, 这里是54321周刊.
查看过往内容: 54321.versun.me

5 有趣:

I. Nvidia GTC 2025

新 GPU 阵容包括 2025 年底推出的 Blackwell Ultra、2026 年推出的 Vera Rubin 和 2028 年推出的 Feynman，每款 GPU 都有望大幅提升性能
首个开放的仿人机器人基础模型 Isaac GR00T N1，以及用于训练机器人的综合物理人工智能数据集
与谷歌 DeepMind 和迪斯尼合作的机器人物理引擎牛顿也首次亮相，非常可爱的星球大战风格的机器人 Blue 登台亮相
全新的 DGX Spark 和 DGX Station 为个人工作站带来了数据中心级的人工智能计算，黄称其为 "人工智能时代的个人超级计算机"
Nvidia 还宣布与汽车制造商通用汽车（GM）建立新的合作伙伴关系，计划为该公司打造首支自动驾驶汽车车队。

II. TxAgent 代理
哈佛大学和麻省理工学院的研究人员发布了 TxAgent，它是一个人工智能代理，利用多步推理和实时生物医学知识检索为患者生成可信的个性化治疗建议，可为医生提供更安全、更有针对性的治疗。

III. Google Gemini 更新

推出个性化功能: 可自动将你的搜索历史和聊天内容添加到上下文，同时还可以添加需记忆的内容以便后续使用
添加 Canvas 互动空间: 可用于完善文档和代码，并实时显示更改内容，类似 Claude Artifacts，同时还集成了 NotebookLM

IV. 值得关注的 LLM 小模型

Phi-4: 微软在2月26号发布 Phi-4-multimodal 多模态语言模型，5.6B 参数，128k 上下文，能够同时处理语音、视觉和文本，非常适合部署在移动设备或者低性能的设备上
Mistral Small 3.1: 多模态语言模型，24B 参数，128k 上下文
Command A: 111B 参数，256k 上下文

V. 可弯曲传播的声音
研究人员发明了自弯曲超声波束，可将声音绕过障碍物，在特定的目标位置汇合，类似光学透镜弯曲光线的原理。
其潜在的应用非常广泛，比如在公共场所不用带耳机即可提供个性化的音频；图书馆可以让学生在不打扰他人的情况下通过语音课程学习；在汽车中，乘客可以听音乐，而不会分散驾驶员听导航指示的注意力；办公室和军事环境也可以受益于用于保密对话的局部语音区；还可用于消除指定区域的噪音，创建安静区域以提高工作场所的注意力或减少城市噪音污染

4 工具:

I. LiveKit
一个面向开发人员构建实时媒体应用的开源平台。它可以轻松集成音频、视频、文本、数据和人工智能模型，同时提供基于 WebRTC 的可扩展实时基础设施。OpenAI 的实时语音对话就是使用的该平台在 LLMs 和用户之间传输音频数据

II. Territory
代码图浏览器工具，可以分析 github 的仓库，生成代码图，方便理解代码

III. TXYZ
人工智能写作辅助工具，从收集信息到整合当前主题风格，再到输出为文章/论文，整个流程体验非常不错

IV. English News In Levels
一个非常不错的英语学习的新闻网站，可以按级别显示，并有基本的单词本和翻译功能

3 文章:

I. 我是如何运作重大项目的
来自 Anthropic 的 PM 介绍他是怎么做项目管理的，有很多实施建议和指南，干货很多。

II. 帮助您简化生活的 12 个日常习惯--少花钱多办事
12个非常简单习惯，可以帮助你简化生活，让生活变得更有趣、更有意义。

III. 为什么你几乎做什么都会失败？
如果你想了解为什么大多数人都一事无成，那么这篇文章值得你看看，至少我中枪了。

当他们遇到创业、结识新朋友或改变整个生活的机会时，他们的潜意识反应是：听起来像是骗局，我不能这么做，因为...，但如果不起作用呢？
你放弃得太早了，你没有学会如何将失败视为通往成功的唯一途径。

2 资源:

I. Phosphor Icons
提供非常精致的图标，免费，且支持的格式很多

II. Yours for the making
来自 Autodesk 的手工品创作分享网站，提供了各种可手工制作物品的详细说明，让你也可以成为手工耿

1 订阅:

I. Ben | [rss]
Ben 目前是一位 Anthropic 的技术人员，他的每篇博文都能引人深思。我是从他这篇推文关注到他的：

当我把计划从 "赚大钱和捐款 "转为 "建造重要的东西 "时，有一件事让我很吃惊，那就是我的工作效率提高了很多。
我想，如果我是通过从事智力上有趣的工作来赚取美元，我就会保持动力。结果发现并非如此

-----

以上就是本期的全部内容啦! 感谢阅读
最后，请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----

如果您喜欢本周刊, 可以通过以下方式来支持它:

成为第12位赞助者
发邮件打个招呼吧
分享到 Twitter

周刊订阅方式：邮件或 RSS
-----

第113期

2025-03-15

2025-03-15 (每周六发布)

我是Versun, 这里是54321周刊.
查看过往内容: 54321.versun.me

5 有趣:

I. 微软正在使用 Go 语言开发 TypeScript 编译器和工具链的原生版本
微软正在开发 TypeScript 的原生版本（TypeScript 7.0），该版本将大幅提升性能，包括将构建时间减少10倍、降低内存使用量，并计划在2025年中期推出命令行类型检查功能，年底前完成项目构建和语言服务的完整实现(repo)

II. Google Gemini 相关更新

Gemini 2.0 Flash 上线原生图像生成功能: 擅长保持角色和场景一致性、通过对话编辑图像以及准确渲染文本。(在线 Chat )
Gemini Robotics: 谷宣布成立 Gemini Robotics 公司，旨在打造通用机器人，还发布了 Gemini Robotics-ER 视觉语言模型，该模型具有增强的空间能力，侧重于空间推理，可帮助机器人在无需训练的情况下完成现实世界中的任务。

III. OpenAI 推出代理套件
添加了新的 responses API 接口，可提供网络搜索、文件扫描和计算机使用三个功能，同时还提供了代理 SDK 以便协调单个/多个代理系统，并提供了安全防护和监控功能。

IV. 从零开始打造一款（T1D）智能手表
作者的 9 岁儿子患有1型糖尿病下(T1D)，为此他制作了一款智能手表，除了基本的防水功能外，还需提供可靠的 CGM 数据，并在血糖水平过低或过高时提供紧急触觉反馈。整个制作过程非常有趣且酷

V. Ink & Switch
一个很有意思的研究实验室，主要探索人类未来思想的工具，愿景是帮助人类更清晰地思考，更有效地协作，目前有3个研究方向：可塑软件、可编程墨水、本地优先协作。
该实验室还有很多相关的实验软件/文章，都非常有意思，建议去玩一玩。

4 工具:

I. Sidekick
一个本地 macOS LLM 聊天应用，LLM 可以从 Mac 上的文件、文件夹和网站中获取信息，而无需安装任何其他软件

II. storm
由LLM驱动的知识整理系统，可对某个主题进行研究，并生成附有引文，类似维基百科的的完整报告

III. Mermaid
基于 JavaScript 的图表制作工具，可嵌入 Github Markdown 中，比如嵌入 README.md 文件，并可进行互动。(playground)

IV. owl
Manus AI 代理平台的开源替代方案

3 文章:

I. 以下是我如何使用 LLMs 来帮助我编写代码的方法
这并不是一篇水文，而是来自 Simon Willison 的干货分享，非常值得一阅，有很多非常细节的使用方法和经验分享

II. 模型就是产品
AI 发展的下一阶段是将复杂功能直接整合到模型内部，而不是通过应用层包装，这意味着模型提供商将主导价值链，而单纯的应用层包装将面临被自动化和颠覆的风险。

III. 检测推理模型中的作弊行为
来自 OpenAI 的研究报告，他们发现大型语言模型可以通过监控其思维链来检测利用漏洞的行为，但对其思维链的过度监测可能会导致模型隐藏其真实意图。
类似“双缝干涉实验”，反映了观测对系统行为的深刻影响，以及系统在面对监控时可能采取的适应或伪装策略。
更深入的讨论，可查看 Less Wrong 的相关分析: The Most Forbidden Technique

2 资源:

I. Docsity
类似百度文库，但主要面向学生，提供了国外各高校的作业、试卷、笔记等文档。下载需要积分(可通过回答问题或者上传文档获取积分)

II. 初创企业首席技术官手册
本书涵盖了高绩效工程团队的基本技能和最佳实践

1 订阅:

I. Alex | [rss]
一名来自英国的软件开发人员、作家和手工制作者，我是在周刊第83期的探索Flickr基金会的时候发现ta的，其博文涉及软件开发、手工艺品等，非常酷。

-----

以上就是本期的全部内容啦! 感谢阅读
最后，请照顾好自己(包括精神上、身体上、情感上)
我们下周见
-----

如果您喜欢本周刊, 可以通过以下方式来支持它:

成为第12位赞助者
发邮件打个招呼吧
关注我的Twitter

周刊订阅方式：邮件或 RSS
-----