指令长度受模型“上下文窗口”(Context Window)限制(如GPT-4 Turbo为128k tokens,Claude 3为200k tokens),过长可能导致模型忽略早期信息或响应变慢。平衡策略包括:
精简冗余信息:删除与任务无关的修饰词(如“非常重要的是,请你务必”→“请”);
关键信息前置:将核心任务(如“总结”“翻译”)放在指令开头,便于模型优先捕捉;
外部化上下文:将大段参考资料(如论文全文)通过“检索增强生成(RAG)”单独存储,指令中仅引用索引(如“参考文档ID:XXX,总结其核心结论”);
动态调整长度:简单任务用短指令(<50字),复杂任务用结构化长指令(但控制在上下文窗口的70%以内,预留输出空间)。
相关阅读