本文介绍了一种称为“元提示词SOP”的方法,用于更有效地利用大模型AI。该方法包括五个步骤:1) 向AI提供原始素材;2) 让AI构建自己的理解体系;3) 进行沙盒模拟与涌现;4) 从导演视角迭代;5) 总结。作者强调,不需要成为行业专家,而是要学会如何让AI扮演专家。
标签 大模型 下的文章
- 首页
- 大模型
2025年11月13日,全球科技领域的重要新闻包括ChatGPT 5.1的发布,其优势在于双模式设计、适应性推理、语气风格控制、命令执行能力提升和更快响应速度。同时,科技基础设施投入加速,国家间科技竞争加剧,资本市场和人才市场也在调整。未来2-3年将成为科技投资、基础设施建设和人才布局的重要窗口期。
全球科技股和半导体股大幅下跌,特别是在亚洲市场,引发对AI增长可持续性及估值泡沫的疑问。分析师认为这是市场调整而非全面崩盘。Apple计划使用Google的Gemini AI模型升级Siri,显示苹果在AI领域的挑战。NVIDIA CEO认为中国可能在AI竞争中超越美国。联想推出“Smarter A...
本周AI领域重要进展包括OpenAI发布Codex CLI 0.48版本,支持Server-Sent Events,提升认证及会话管理体验;vLLM发布支持批次不变推理功能;NeuralOperator 2.0支持多分辨率训练;Gemini 3发布,具备卓越编码体验与SVG生成能力;研究指出Clau...
本文汇总了全球AI领域的最新进展,包括AI模型与智能体、企业动态、机器人与具身智能、AI创作、行业研究、AI政策、工具与开发者生态、市场与宏观经济、教育与职业趋势以及未来展望等方面的信息。Anthropic、xAI、Google、OpenAI等公司在AI模型和智能体方面取得显著进展,NVIDIA、T...
本文汇总了全球科技动态,包括模型/产品发布与功能更新、研究论文与技术进展、行业与基础设施、机器人与实体应用、安全、治理与合规、工具、课程与资源、观点与争议以及市场与数据点。重点关注了Agent化与工作流平台化、推理效率与低精度训练、视频原生能力竞赛、算力—电力—网络三位一体基础设施加速等主线。同时,...
全球科技动态速览:知乎发布GLM-4.6,Meta推出MobileLLM-R1,OpenAI发布ChatGPT即时结账功能,Google预计发布Gemini 3.0,NVIDIA发布Nemotron开源技术,Meta计划收购Rivos,AI工具与平台如LlamaIndex、ask_ui、Granol...
本文全面概述了全球科技的最新动态,包括行业观点、模型与技术进展、企业与产品动态、学术与教育动态、医疗与AI应用以及其他杂项。文章讨论了AI工具使用、经济影响、大模型开源争议等关键议题,同时涉及了多个领域的技术突破,如自然语言处理、机器人技术、视频与图像技术等。企业动态方面,OpenAI、Google...
本文介绍了如何与大型语言模型合作,这些模型通过训练学习预测文本。文章解释了大型语言模型的工作原理,包括它们如何学习拼写、语法、改写、回答问题、进行对话、多语言写作和编码等。文章还讨论了如何通过指令、补全、场景和演示来控制大型语言模型,以及如何通过微调来训练定制模型。此外,文章还提到了大型语言模型在编...
清华大学计算机系崔鹏教授团队联合稳准智能研发的结构化数据通用大模型“极数”(LimiX)正式开源,标志着我国在结构化数据智能处理领域的技术突破与生态开放迈出关键一步。该模型能够支持分类、回归、高维表征抽取、因果推断等多达10类任务,在工业时序预测、异常数据监测、材料性能预测等场景中,性能达到甚至超越...
AI Agent是一种利用人工智能技术实现特定目标并为用户完成任务的软件系统,具备推理、规划、记忆和自主性等能力。其核心功能组件包括“大脑”(核心LLM、推理与规划)、感知与行动模块、Memory(学习与维护上下文)、工具集成与使用以及路由器/控制器。Agent系统运维基础设施包括LLM API网关...
本文提供了AI大模型在不同领域的应用架构图,包括技术全景视图、通用技术架构、知识库业务架构、农业、导购、物联网、合规风控管理、合规管理、Agent平台、CRM等多个方面的架构图。这些架构图为理解和应用AI大模型提供了直观的参考。
OCR-Reasoning是一个评估多模态大模型在复杂图文推理任务中能力的基准,包括空间关系理解、数值计算与分析、逻辑推理等六种核心推理能力。它涵盖了18种实际推理任务,数据来源广泛,包括互联网图片、真实世界照片和现有基准数据集。推理过程标注详细,包括人工标注和利用Gemini 2.0 flash生...
文章提供了一份《智能体创业100个关键问题清单》,旨在帮助AI智能体创业者,尤其是面向消费者的小团队,避免走弯路。清单涵盖了战略定位、技术路线、产品体验、商业化路径、竞争与护城河、团队与资源、融资与资本、风险与预案以及长期价值与愿景等九个层面的问题,强调小团队应快速将通用技术转化为专用体验,找到场景...
李飞飞团队与DeepMind合作开发了模态链(CoM)技术,使机器人能够通过观看人类演示视频学习执行操作任务。CoM通过整合视觉、肌肉信号和音频数据,使机器人能够提取任务计划和控制参数,从而执行拧瓶盖、插插头等动作,准确率提高200%。这项技术让机器人更接近“具身智能”,能够理解和模仿人类的精细操作...
本文详细介绍了9大类型、50个实用的AI Agent开源工具,包括计算机与浏览器操作、框架、语音、文档理解、记忆、测试与评估、监控与可观测性、仿真环境和垂直领域Agent。这些工具可以帮助开发者构建和优化AI智能体,提高开发效率。
2025年6月AI资讯汇总显示,AI技术在多个领域取得突破,包括谷歌Gemini 2.5 Pro模型、Anthropic的Claude 4系列模型、DeepSeek-R1-0528版本、腾讯混元图像2.0、中国石油昆仑大模型等。新产品与应用方面,PixVerse、快手、Opera、京东工业、Mini...
随着AI技术的发展,地球上的数据中心电力需求激增,能源瓶颈难以解决。因此,越来越多的公司和投资者开始考虑在太空中建立数据中心,利用太阳能满足能源需求。美国初创公司Starcloud计划今年8月发射搭载英伟达H100芯片的卫星,这将是第一颗轨道数据中心。尽管面临技术与经济挑战,但轨道数据中心的初期应用...
本文是《从零开始的大语言模型原理与实践教程》第七章,介绍了大模型的应用。首先,讨论了大模型评测的重要性,包括评测数据集和主流评测榜单。然后,介绍了检索增强生成(RAG)技术,包括其基本原理和搭建RAG框架的步骤。最后,讨论了LLM Agent的概念、类型,并提供了一个简单的任务导向型Agent的实现...
本文详细介绍了如何使用Transformers框架进行大型语言模型(LLM)的训练,包括预训练、有监督微调和高效微调。预训练部分讲解了使用Transformers框架和分布式框架deepspeed进行模型预训练的全过程,包括模型初始化、数据预处理和使用Trainer进行训练。有监督微调部分则介绍了如...