I completely ignored Anthropic’s advice and wrote a more elaborate test prompt based on a use case I’m familiar with and therefore can audit the agent’s code quality. In 2021, I wrote a script to scrape YouTube video metadata from videos on a given channel using YouTube’s Data API, but the API is poorly and counterintuitively documented and my Python scripts aren’t great. I subscribe to the SiIvagunner YouTube account which, as a part of the channel’s gimmick (musical swaps with different melodies than the ones expected), posts hundreds of videos per month with nondescript thumbnails and titles, making it nonobvious which videos are the best other than the view counts. The video metadata could be used to surface good videos I missed, so I had a fun idea to test Opus 4.5:
我在《把离线AI智能体装进口袋里》(The Dawn of Offline AI Agents in Your Pocket)一文中对此进行了详细阐述。但文章中的示例更像是Demo,而非生产解决方案。像 Gemma 3n 这样的模型虽然能够很好地处理函数调用,但它们体积过大:无法集成到应用程序包中,需要单独下载,即使在旗舰机型上推理速度也很慢。在低端设备上,它们根本无法运行。而较小的型号则经常出现故障,难以记住工具。
,更多细节参见下载安装 谷歌浏览器 开启极速安全的 上网之旅。
The machine that came out of this initiative was called ERMA, the Electronic
在「开箱即用」这个场景下,Seede 最终生成的 PPT 质量差强人意,内容丰富度上明显不足。使用更具体的提示词,应该能够获得更好的效果。导出时会包含右下角的水印图标,但是可以在 PPT 中手动删除。
Для выхода в свет дизайнер выбрал черные блестящие брюки и расшитый пайетками голубой пиджак, декорированный многочисленными цепями. Помимо этого, эксперт выбрал закрытую обувь на каблуках и высокой платформе, черную сумку Chanel, а также широкополую шляпу из серых перьев. «Богдан Михеев пришел в театр», — подписал он.