你有需求? 点击这里 尝试让 AI 为你生成Baklib调研方案!

Baklib Logo

基于GenAI的智能体:技术文档中的表格结构设计

  浏览:0 巴克励步

表格是呈现复杂信息的有效形式,但大型语言模型处理结构化表格面临挑战,需重构以适应其摄取,遵循不用符号、无空值等最佳实践,且评估生成响应质量有相应框架。

基于GenAI的智能体:技术文档中的表格结构设计
通过表格形式的文本来有效地呈现复杂信息。表格提供了一种简洁的方式,将大量信息浓缩并以视觉上吸引人的方式呈现。表格是一种自然的形式,可以向最终用户阐明复杂的信息结构,无需任何媒体工具。技术写作者使用表格数据来理解关键点、趋势、相似性和关系。这些数据使他们能够分析和构建文档。技术写作领域已经在内容创作过程中广泛采用了表格的使用。
表格内容以行和列的形式组织。表格通常包含标题信息,为每个单元格中的值提供上下文。任何简单的表格都可以重构为有序的层次结构,从而形成多维表格。世界上许多结构化信息都以表格形式组织。表格最简单的用例之一是目录,它以索引和主题的形式概括了整个知识库。有时,技术写作者根据内容类型以及用户体验界面限制,更倾向于使用行表或列表。列表更适合移动设备,而行表则更适合桌面设备。 大型语言模型面临挑战 大型语言模型基于互联网上大量的文本数据进行训练。这些文本数据是非结构化的,而表格的结构化特性给大型语言模型带来了独特的挑战。大型语言模型设计用于处理和解析海量的非结构化文本数据;当面对表格数据时,它面临着范式的转变。另一层复杂性在于对表格数据的数值推理和聚合,这些数据通常密集地混合了数值和文本信息。这可能导致关键细节被掩盖,从而可能影响大型语言模型的决策能力。尽管技术文档编写者倾向于以表格形式呈现某些信息,但大型语言模型在处理上的障碍,给如何利用这些表格信息来生成对客户问题(提示)的回应带来了挑战。为了帮助大型语言模型理解结构化信息,表格必须进行重构。 知识库内容中的表格需要被重构,以使其适合由大型语言模型驱动的业务应用程序摄取。以下是重构表格时应遵循的一些最佳实践: 
  • 不要在表格内容中使用符号,因为在预处理步骤中它们会被移除。
  •  表格内容中不要有空值/空格,因为基于 GenAI 的智能体在使用这些数据时可能会产生幻觉!
  •  确保表格具有表头信息和正确的行
  •  如果希望将某些二进制信息作为表格内容的一部分,请使用是/否、真/假或任何其他选项。确保此信息在您的 RAG(检索增强生成)工具的系统消息中有所涵盖
  •  表格应完整,所有单元格都应包含值
  •  使用  标签来定义表格内容中的术语缩写
  •  使用  标签来描述勾号和叉号,以便 LLM 能够理解表格内容中符号的含义
  •  表格单元格的值可以是数值和文本的混合。但是,建议在这些表格单元格中只存在一种类型的数据

针对基于 GenAI 的智能体进行表格评估

向 LLM 解析数据可以采用 Markdown 格式或 HTML 标签。Markdown 格式在表达表头信息和表格的多个维度方面存在局限性。HTML 标签提供了灵活性,但代价是 LLM API 施加的 Token 预算。建议避免使用表格,因为最先进的 LLM 技术仅能基于用户提示(问题)的表格内容产生 74% 准确的结果。技术作者应以文本形式而非表格形式来阐述复杂信息。现在,以表格格式(在输出/响应中)生成内容是用户的选择,而不是内容制作者的选择。因此,技术作者需要权衡这些表格,为最终用户提供更多自由。
大语言模型(LLM)能够以表格形式生成响应。如果你的组织有特定的表格结构要求,可以通过微调LLM使其适应你的组织表格格式,或者通过巧妙的用户提示工程也能实现。对于基于生成式人工智能(GenAI)的智能体生成的响应,技术作者必须针对特定用户问题(提示),依据表格内容来评估其质量。OpenAI Evals、RAGAS 和 Galileo labs 等框架为评估生成响应的质量提供了基础。
表格是表达复杂信息的优雅方式,这一点很重要。建议避免在知识库内容中添加表格。在特定情况下重构表格时,遵循上述提出的指导原则,将有助于当前的LLM技术提供商基于表格内容生成更准确的响应。鉴于基于GenAI的智能体将作为最终用户与你内容之间的接口,让最终用户自由选择他们希望响应以何种格式呈现是至关重要的。
Baklib是一款直观的知识库软件,可以轻松添加你的内容并与任何应用程序集成。立即尝试Baklib!
Baklib 可组合内容平台将内容构建块整合在一起,一次创建即可重复用于任何数字体验。随着数字体验和技术的发展,API 优先平台可轻松与数据源和新功能集成。借助内置编排、强大的应用生态系统和可轻松扩展平台的应用框架,Baklib 让整个企业的团队能够协同工作,更高效地连接、创建和扩展内容。Baklib 帮助公司释放数字内容的力量,使他们能够更快地构建和大规模交付,从而使其内容成为战略性业务资产。近 5 年来数千家公司依靠 Baklib 帮助他们将最佳创意变为现实。
Baklib Birds
to top icon