1. browserbase/stagehand
分类:开源项目来源:github_search分数:10作者:browserbase时间:2026-02-21T01:56:42Z
Browserbase 在 GitHub 开源 Stagehand 浏览器自动化框架,用“自然语言+代码”结合与自动缓存/自愈机制提升生产环境自动化的可靠性与可维护性。
- Stagehand 定位为 AI Browser Automation Framework,可通过自然语言和代码共同控制浏览器。
- 项目强调在低层框架与纯代理式方案之间提供折中:开发者可按场景选择代码或自然语言。
- 支持 AI 动作预览与可复用动作缓存,帮助把一次性 AI 操作沉淀为可重复工作流并节省 token。
- 具备自动缓存与 self-healing 能力,站点变化导致流程失效时可按需重新引入 AI 推理。
- 提供文档站点、Discord 社区、MIT 许可证,并给出 Python 实现仓库链接。
#GitHub #repo #开源项目 #Stagehand #Browserbase
2. T8RIN/ImageToolbox
分类:开源项目来源:github_search分数:5作者:T8RIN时间:2026-02-21T01:53:03Z
GitHub上的 ImageToolbox 提供一款基于 Kotlin/Jetpack Compose 的 Android 图像编辑工具,集成裁剪、滤镜、EXIF 编辑、抠图和 AI 增强等能力,重要性在于其免费开源且多渠道分发,便于用户与开发者直接使用和参与迭代。
- 项目定位为多功能图片处理工具,支持高效照片编辑与增强。
- 核心功能涵盖裁剪、滤镜、EXIF 数据编辑、背景擦除和 AI 图像增强。
- 技术栈包括 Kotlin、Jetpack Compose,最低支持 Android API 23+。
- 提供 GitHub Releases、Google Play、F-Droid 等下载与分发渠道。
- 配套 Wiki、Telegram 社区与 CI 通知渠道,便于获取文档和测试版动态。
#GitHub #repo #开源项目 #Android #Kotlin #Jetpack Compose #F-Droid
3. tensorzero/tensorzero
分类:开源项目来源:github_search分数:5作者:tensorzero时间:2026-02-21T01:48:47Z
TensorZero 在 GitHub 展示了一个面向工业级 LLM 应用的开源全栈,统一多模型接入并提供观测、优化、评测与实验能力,重要性在于可显著降低多供应商集成和持续迭代成本。
- 提供统一 LLM Gateway,一次接入即可调用多家主流模型与 OpenAI 兼容接口,支持流式、工具调用、结构化输出、多模态等能力。
- 强调生产可用性与性能:基于 Rust,宣称在 10k+ QPS 下网关 p99 额外延迟低于 1ms,并内置路由、重试、回退、限流和鉴权。
- 内置可观测性体系,可将推理与反馈写入自有数据库,并支持 UI/编程方式分析、回放历史推理及构建数据集。
- 覆盖优化与评测闭环:支持提示词/模型/推理策略优化(含 GEPA、MIPROv2、RLHF 等)以及启发式和 LLM Judge 评测。
- 提供实验能力(如自适应 A/B 测试)与多语言接入方式(Python SDK、OpenAI SDK、HTTP API),并预告自动化优化产品 Autopilot。
#GitHub #repo #开源项目
4. Gemini 3 Deep Think: Optimizing 2D semiconductor fabrication
分类:视频/演讲来源:youtube_rss分数:100作者:Google DeepMind时间:2026-02-20T20:58:56+00:00
Google DeepMind视频介绍杜克大学Wang Lab使用Gemini 3 Deep Think优化二维半导体晶体生长工艺,成功设计出可制备超过100μm薄膜的精确方案,显示AI在高难材料研发中的实用价值。
- 杜克大学Wang实验室将Gemini 3 Deep Think用于材料科学中的晶体生长工艺优化。
- 模型结合专家级科学知识与研究级数据,生成了具体可执行的制备配方。
- 该方案实现了超过100μm薄膜生长目标,突破了以往方法难以达到的指标。
#YouTube #视频/演讲 #GoogleDeepMind
5. Gemini 3 Deep Think: Identifying logical errors in complex mathematics research
分类:视频/演讲来源:youtube_rss分数:100作者:Google DeepMind时间:2026-02-20T20:58:52+00:00
Google DeepMind发布视频称Gemini 3 Deep Think在审阅高能物理与无限维代数论文时发现了人类同行评审遗漏的细微逻辑错误,显示其在复杂数学推理质检中的潜在科研价值。
- 视频主题是Gemini 3 Deep Think在复杂数学研究中的逻辑错误识别能力。
- 罗格斯大学数学家Lisa Carbone使用该模型审阅一篇高能物理与无限维代数方向的专业论文。
- 模型找到了此前通过人类同行评审但未被发现的细微逻辑漏洞。
- 内容指向Google官方博客,强调Gemini 3 Deep Think推理能力的提升与科研应用前景。
#YouTube #视频/演讲 #Gemini 3 Deep Think
6. Gemini 3 Deep Think: Accelerating mechanical engineering and rapid prototyping
分类:视频/演讲来源:youtube_rss分数:100作者:Google DeepMind时间:2026-02-20T20:58:49+00:00
Google团队在视频中展示Gemini 3 Deep Think可基于文本与图像推理几何约束并生成可3D打印涡轮叶片设计,说明其有望降低机械设计门槛并加速复杂原型开发。
- Google Platforms and Devices部门研发负责人Anupam Pathak测试了Gemini 3 Deep Think在机械工程流程中的应用。
- 模型可同时接收文本提示和图像参考,针对几何约束进行推理。
- 演示任务是生成可3D打印的涡轮叶片设计,该任务通常依赖专业CAD能力。
- 核心价值在于缩短从逻辑需求到物理可执行方案的设计与打样周期。
#YouTube #视频/演讲 #Gemini 3 Deep Think #CAD
7. Project Genie | Skydiving
分类:视频/演讲来源:youtube_rss分数:94作者:Google DeepMind时间:2026-02-20T11:29:39+00:00
Google DeepMind发布Project Genie“Skydiving”演示,展示可通过文本或图片实时生成可游玩的交互世界,这使低门槛创作和快速迭代游戏场景成为可能。
- 视频介绍了Project Genie作为Google的研究原型,用于生成可游玩的世界。
- 用户可仅凭文本或图像提示生成交互环境,并在游玩过程中实时构建。
- 项目提供预制世界图库,支持直接游玩或二次混编(remix)。
- 示例场景为高空滑翔穿环玩法,强调即时交互与动态生成能力。
#YouTube #视频/演讲 #Project Genie
8. Project Genie | Silver Sphere
分类:视频/演讲来源:youtube_rss分数:94作者:Google DeepMind时间:2026-02-20T11:29:35+00:00
Google DeepMind 在视频中展示研究原型 Project Genie:用户可通过文本或图片实时生成并游玩可交互世界,这重要在于显著降低游戏世界创作门槛并拓展可玩内容生产方式。
- Project Genie 是 Google 的“可游玩世界生成”研究原型。
- 用户仅需文本或图像提示,即可生成可交互环境。
- 生成过程可在游玩时实时构建与更新世界。
- 提供预制世界画廊,支持直接游玩或二次 remix。
- 示例场景包含物理交互(碰撞黄色球)与反射效果(银色球体)。
#YouTube #视频/演讲 #Project Genie
9. Project Genie | Shine and Seek
分类:视频/演讲来源:youtube_rss分数:94作者:Google DeepMind时间:2026-02-20T11:29:32+00:00
Google DeepMind 发布视频介绍研究原型 Project Genie,可由文本或图像实时生成可交互世界并支持游玩与改造,展示了生成式AI在游戏内容创作与即时交互上的潜力。
- Project Genie 是 Google 的“可玩世界”研究原型。
- 用户可通过文本或图像提示生成互动环境,且在游玩过程中实时构建。
- 提供预制世界画廊,支持直接游玩或 remix(二次改造)。
- 示例场景为夜间湿地探索,玩家用手电搜寻狐狸。
#YouTube #视频/演讲 #Project Genie
10. Project Genie | Ruin Rover
分类:视频/演讲来源:youtube_rss分数:94作者:Google DeepMind时间:2026-02-20T11:29:29+00:00
Google DeepMind 发布视频介绍 Project Genie 的“Ruin Rover”示例,展示用文本或图像实时生成可交互游戏世界,这意味着生成式AI正从内容创作走向可玩体验构建。
- Project Genie 是 Google 的研究原型,目标是创建可游玩的生成式世界。
- 用户可通过文本或图像提示生成交互环境,并在游玩过程中实时构建场景。
- 项目提供预制世界画廊,支持直接游玩或二次 remix。
- 视频示例“Ruin Rover”中,玩家以遥控车视角探索神秘遗迹。
#YouTube #视频/演讲 #Project Genie
11. Project Genie | Rollerball
分类:视频/演讲来源:youtube_rss分数:94作者:Google DeepMind时间:2026-02-20T11:29:26+00:00
Google DeepMind发布视频介绍研究原型Project Genie,可通过文本或图像实时生成可交互游戏世界并支持重混,这展示了生成式AI在即时游戏内容创作与交互物理模拟上的潜力。
- Project Genie是Google的研究原型,目标是创建可游玩的生成式世界。
- 用户可用文本或图片提示生成交互环境,且在游玩过程中实时构建与变化。
- 提供预制世界画廊,支持直接游玩或在现有世界基础上重混创作。
- 示例“Rollerball”通过轨迹绘制测试系统对玩家行为记忆、环境反射和水体物理的表现。
#YouTube #视频/演讲 #Project Genie
12. Project Genie | Puddle Jumper
分类:视频/演讲来源:youtube_rss分数:94作者:Google DeepMind时间:2026-02-20T11:29:23+00:00
Google DeepMind在视频中展示了Project Genie原型:可通过文本或图像提示实时生成可交互世界并支持游玩与改编,这重要在于显著降低了互动内容创作门槛并拓展了生成式AI在游戏场景的应用。
- Project Genie是Google的研究原型,目标是创建可游玩的生成式世界。
- 用户仅需文本或图片提示,即可生成并实时构建交互式环境。
- 项目提供预制世界画廊,支持直接游玩或二次 remix 改编。
- 示例场景为水彩风雨天世界,玩家以粉色兔子进行跳跃体验。
#YouTube #视频/演讲 #Project Genie
13. Project Genie | Meadow
分类:产品/发布来源:youtube_rss分数:94作者:Google DeepMind时间:2026-02-20T11:29:20+00:00
Google 推出研究原型 Project Genie,可通过文本或图像提示实时生成可玩的交互世界并支持游玩改编,这降低了互动内容创作门槛并展示了生成式游戏的潜力。
- Project Genie 是 Google 的“可玩世界生成”研究原型。
- 用户可用文本或图片提示生成交互环境,且世界会在游玩过程中实时构建。
- 提供预设世界画廊,用户可直接体验或 remix 二次改造。
- 示例场景包括以柴犬视角探索金色时刻的神秘高山林地。
#YouTube #产品/发布 #Google #DeepMind
14. Project Genie | Library Cat
分类:视频/演讲来源:youtube_rss分数:94作者:Google DeepMind时间:2026-02-20T11:29:17+00:00
Google DeepMind发布视频介绍Project Genie“Library Cat”示例,展示用文本或图像提示实时生成可游玩的互动世界,这对降低游戏内容创作门槛和探索生成式交互体验很重要。
- Project Genie是Google的研究原型,目标是创建可游玩的生成式世界。
- 用户可通过文本或图像提示生成互动环境,并在游玩过程中实时构建内容。
- 项目提供可直接体验或二次改编的预制世界画廊。
- 视频示例“Library Cat”展示了在不断扩展的庄园图书馆中穿门探索多个房间的玩法。
#YouTube #视频/演讲 #Project Genie
15. Project Genie Gallery | Ice Palace
分类:产品/发布来源:youtube_rss分数:94作者:Google DeepMind时间:2026-02-20T11:29:13+00:00
Google DeepMind 展示了 Project Genie 的“冰雪宫殿”可玩世界,说明其可通过文本或图像实时生成并可交互的游戏环境,这对降低游戏内容创作门槛和加速原型迭代具有重要意义。
- Project Genie 是 Google 的研究原型,用于创建可游玩的互动世界。
- 用户可通过文本或图像提示生成环境,并在游玩过程中实时构建内容。
- 该视频展示了 Gallery 预设世界“Ice Palace”,可驾驶雪地摩托在冰雪城市中穿行并躲避障碍。
- 平台支持游玩与 Remix 现有世界,体现可复用与二次创作能力。
#YouTube #产品/发布 #Project Genie #Ice Palace
16. Project Genie Gallery | Glowing Glade
分类:视频/演讲来源:youtube_rss分数:94作者:Google DeepMind时间:2026-02-20T11:29:10+00:00
Google DeepMind 发布 Project Genie Gallery 的“Glowing Glade”演示视频,展示通过文本或图像提示实时生成可交互世界并支持游玩/二创,这凸显了生成式 AI 在游戏内容创作与交互体验上的潜在变革价值。
- 视频介绍了 Google 的研究原型 Project Genie,可根据文本或图片提示生成可游玩的互动环境。
- 生成的世界可在玩家游玩过程中实时构建,强调动态交互与即时内容生成能力。
- Project Genie 提供预制世界画廊,用户可直接游玩或在此基础上 remix(二次创作)。
- 示例场景“Glowing Glade”中,玩家以兜帽骷髅角色穿行于发光水晶遍布的神秘森林。
#YouTube #视频/演讲 #Project Genie
17. Project Genie Gallery | Folded Flyer
分类:视频/演讲来源:youtube_rss分数:94作者:Google DeepMind时间:2026-02-20T11:29:07+00:00
Project Genie is Google’s research prototype for creating playable worlds. With just a text or image prompt, you can generate interactive environments that bui…
- Project Genie is Google’s research prototype for creating playable worlds
- With just a text or image prompt, you can generate interactive environments that build in real time, as you play them
- Project Genie also features a gallery of premade worlds that users can play or remix
- In this world, you can sail along the water or fly through the sky to get a new perspective
- Learn more: https://labs
- google/projectgenie
___
Subscribe to our channel https://www
#YouTube #视频/演讲
18. Project Genie Gallery | Felt Slow
分类:视频/演讲来源:youtube_rss分数:94作者:Google DeepMind时间:2026-02-20T11:29:03+00:00
Project Genie is Google’s research prototype for creating playable worlds. With just a text or image prompt, you can generate interactive environments that bui…
- Project Genie is Google’s research prototype for creating playable worlds
- With just a text or image prompt, you can generate interactive environments that build in real time, as you play them
- Project Genie also features a gallery of premade worlds that users can play or remix
- In this world, you can push the limits of snail speed as you explore a colorful felted racetrack
- Learn more: https://labs
- google/projectgenie
___
Subscribe to our channel https://www
#YouTube #视频/演讲
19. The Codex app enables massively parallel work
分类:视频/演讲来源:youtube_rss分数:83作者:OpenAI时间:2026-02-19T17:26:03+00:00
"The Codex app lets you go further, do more in parallel, and go deeper on the problems you care about." -gdb
- "The Codex app lets you go further, do more in parallel, and go deeper on the problems you care about
- " -gdb
#YouTube #视频/演讲
20. e2b-dev/E2B
分类:开源项目来源:github_search分数:5作者:e2b-dev时间:2026-02-21T02:00:08Z
<!-- <p align="center">
<img width="100" src="/readme-assets/logo-circle.png" alt="e2b logo">
</p> -->
!E2B SDK Preview
!E2B SDK Preview
<h4 align="center">…
- Sign up to E2B [here](https://e2b.dev).
- Get your API key [here](https://e2b.dev/dashboard?tab=keys).
- Set environment variable with your API key
- 🟢 GCP
- 🚧 AWS
- [ ] Azure
#GitHub #repo #开源项目