标签大模型下的文章

GPT-image-2 必看的13个案例（附提示词）

本文介绍了GPT-image-2的13个实用案例和prompt模板，展示了其在中文渲染、内容设计、极简提示词支持等方面的能力。案例包括图鉴式拆解图、古文真迹、科普百科图、电商详情图、健身信息图、高考真题试卷、旅游攻略信息图、古人穿越现代社交平台图、游戏实机截图、人物关系图、密集中文排版和中西医手写药...

2026 年 04 月 23 日

Hermes 保姆级教程：从入门到精通

本文是一篇关于Hermes Agent的全面教程，从入门到精通，包括Hermes的优势、安装部署、三层记忆机制、技能系统、通讯平台接入、自动化流转等方面的详细介绍。Hermes Agent是一个自改进AI框架，具有自动学习循环闭环，能够自动归档记忆、创建技能、自我进化等。文章还提供了9条变现路径，帮...

2026 年 04 月 21 日

Google Deepmind论文解读：如何给AI Agent 投毒

Google DeepMind的论文《AI Agent Traps》系统性地梳理了针对AI智能体的攻击方式，并将其分为六大类：内容注入陷阱、语义操控陷阱、认知状态陷阱、行为控制陷阱、系统性陷阱和人在回路陷阱。这些攻击方式可以叠加使用，对AI智能体构成严重威胁。论文提出了技术防御、生态层面干预和法律与...

2026 年 04 月 21 日

企业级 AI Harness Engineering 落地方案（简版）

文章介绍了AI Harness Engineering的概念和重要性，强调了在企业管理系统中应用AI时，需要构建一个可控的运行环境、工具体系、规则约束、验证回归和监控闭环，以确保AI的稳定交付结果。文章提出了一个7层架构模型，包括任务层、上下文层、工具层、规则层、验证层、观测层和反馈闭环层，并建议企...

2026 年 03 月 28 日

AI大模型沟通语言系列-《Markdown语法教程》

本文介绍了Markdown语法的重要性，特别是在与AI大模型沟通时，使用Markdown格式可以提高沟通效率。文章提供了一个Markdown语法入门教程，并通过15张幻灯片图片详细讲解了Markdown的基本语法和使用方法。

2026 年 03 月 01 日

驾驭大模型之元提示词 SOP

本文介绍了一种称为“元提示词SOP”的方法，用于更有效地利用大模型AI。该方法包括五个步骤：1) 向AI提供原始素材；2) 让AI构建自己的理解体系；3) 进行沙盒模拟与涌现；4) 从导演视角迭代；5) 总结。作者强调，不需要成为行业专家，而是要学会如何让AI扮演专家。

2025 年 12 月 06 日

今日（2025-11-13）全球科技相关的重要新闻，ChatGPT5.1正式发布

2025年11月13日，全球科技领域的重要新闻包括ChatGPT 5.1的发布，其优势在于双模式设计、适应性推理、语气风格控制、命令执行能力提升和更快响应速度。同时，科技基础设施投入加速，国家间科技竞争加剧，资本市场和人才市场也在调整。未来2-3年将成为科技投资、基础设施建设和人才布局的重要窗口期。

2025 年 11 月 13 日

全球AI相关信息简报｜2025-11-06

全球科技股和半导体股大幅下跌，特别是在亚洲市场，引发对AI增长可持续性及估值泡沫的疑问。分析师认为这是市场调整而非全面崩盘。Apple计划使用Google的Gemini AI模型升级Siri，显示苹果在AI领域的挑战。NVIDIA CEO认为中国可能在AI竞争中超越美国。联想推出“Smarter A...

2025 年 11 月 06 日

全球AI相关信息简报｜2025-10-26

本周AI领域重要进展包括OpenAI发布Codex CLI 0.48版本，支持Server-Sent Events，提升认证及会话管理体验；vLLM发布支持批次不变推理功能；NeuralOperator 2.0支持多分辨率训练；Gemini 3发布，具备卓越编码体验与SVG生成能力；研究指出Clau...

2025 年 10 月 26 日

全球AI相关信息简报｜2025-10-19

本文汇总了全球AI领域的最新进展，包括AI模型与智能体、企业动态、机器人与具身智能、AI创作、行业研究、AI政策、工具与开发者生态、市场与宏观经济、教育与职业趋势以及未来展望等方面的信息。Anthropic、xAI、Google、OpenAI等公司在AI模型和智能体方面取得显著进展，NVIDIA、T...

2025 年 10 月 20 日

2025-10-13 全球科技动态速览

本文汇总了全球科技动态，包括模型/产品发布与功能更新、研究论文与技术进展、行业与基础设施、机器人与实体应用、安全、治理与合规、工具、课程与资源、观点与争议以及市场与数据点。重点关注了Agent化与工作流平台化、推理效率与低精度训练、视频原生能力竞赛、算力—电力—网络三位一体基础设施加速等主线。同时，...

2025 年 10 月 14 日

2025-10-01 全球科技动态速览

全球科技动态速览：知乎发布GLM-4.6，Meta推出MobileLLM-R1，OpenAI发布ChatGPT即时结账功能，Google预计发布Gemini 3.0，NVIDIA发布Nemotron开源技术，Meta计划收购Rivos，AI工具与平台如LlamaIndex、ask_ui、Granol...

2025 年 10 月 02 日

2025-09-26 全球科技动态速览

本文全面概述了全球科技的最新动态，包括行业观点、模型与技术进展、企业与产品动态、学术与教育动态、医疗与AI应用以及其他杂项。文章讨论了AI工具使用、经济影响、大模型开源争议等关键议题，同时涉及了多个领域的技术突破，如自然语言处理、机器人技术、视频与图像技术等。企业动态方面，OpenAI、Google...

2025 年 09 月 26 日

How to work with large language models

本文介绍了如何与大型语言模型合作，这些模型通过训练学习预测文本。文章解释了大型语言模型的工作原理，包括它们如何学习拼写、语法、改写、回答问题、进行对话、多语言写作和编码等。文章还讨论了如何通过指令、补全、场景和演示来控制大型语言模型，以及如何通过微调来训练定制模型。此外，文章还提到了大型语言模型在编...

2025 年 09 月 10 日

清华团队开源发布首个结构化数据通用大模型

清华大学计算机系崔鹏教授团队联合稳准智能研发的结构化数据通用大模型“极数”（LimiX）正式开源，标志着我国在结构化数据智能处理领域的技术突破与生态开放迈出关键一步。该模型能够支持分类、回归、高维表征抽取、因果推断等多达10类任务，在工业时序预测、异常数据监测、材料性能预测等场景中，性能达到甚至超越...

2025 年 08 月 29 日

AI Agent 基础设施详解

AI Agent是一种利用人工智能技术实现特定目标并为用户完成任务的软件系统，具备推理、规划、记忆和自主性等能力。其核心功能组件包括“大脑”（核心LLM、推理与规划）、感知与行动模块、Memory（学习与维护上下文）、工具集成与使用以及路由器/控制器。Agent系统运维基础设施包括LLM API网关...

2025 年 08 月 03 日

AI大模型应用架构图大全

本文提供了AI大模型在不同领域的应用架构图，包括技术全景视图、通用技术架构、知识库业务架构、农业、导购、物联网、合规风控管理、合规管理、Agent平台、CRM等多个方面的架构图。这些架构图为理解和应用AI大模型提供了直观的参考。

2025 年 06 月 27 日

OCR-Reasoning：揭秘多模态大模型在复杂图文推理中的真实能力

OCR-Reasoning是一个评估多模态大模型在复杂图文推理任务中能力的基准，包括空间关系理解、数值计算与分析、逻辑推理等六种核心推理能力。它涵盖了18种实际推理任务，数据来源广泛，包括互联网图片、真实世界照片和现有基准数据集。推理过程标注详细，包括人工标注和利用Gemini 2.0 flash生...

2025 年 06 月 23 日

AI智能体创业，一定要搞清楚这100个问题清单

文章提供了一份《智能体创业100个关键问题清单》，旨在帮助AI智能体创业者，尤其是面向消费者的小团队，避免走弯路。清单涵盖了战略定位、技术路线、产品体验、商业化路径、竞争与护城河、团队与资源、融资与资本、风险与预案以及长期价值与愿景等九个层面的问题，强调小团队应快速将通用技术转化为专用体验，找到场景...

2025 年 06 月 19 日

李飞飞团队提出模态链，机器人仅凭人类演示视频就能精准操作，准确率提升 200%

李飞飞团队与DeepMind合作开发了模态链（CoM）技术，使机器人能够通过观看人类演示视频学习执行操作任务。CoM通过整合视觉、肌肉信号和音频数据，使机器人能够提取任务计划和控制参数，从而执行拧瓶盖、插插头等动作，准确率提高200%。这项技术让机器人更接近“具身智能”，能够理解和模仿人类的精细操作...

2025 年 06 月 15 日