UQLMUQLM 是一个用于大型语言模型(LLM)幻觉检测的 Python 库,采用最先进的不确定性量化技术。UQLM 提供了一套响应级评分器,用于量化大型语言模型(LLM)输出的不确定性。每个评分器返回一个介于 0 和 1 之间的置信度得分,得分越高表示错误或幻觉的可能性越低。02660AI工具# UQLM# 大语言模型# 幻觉