tocheck吧 关注:5贴子:173
  • 0回复贴,共1

标书查重算法及使用技巧

取消只看楼主收藏回复

标书查重是用来辅助判断围标串标行为的重要手段,一个好的标书查重系统需要拥有优化过的查重算法。
比如一个场景,投标文件中会大量复制招标文件中的一些技术和商务条款,
这就导致比对的标书中存在大量重复,相似度很高。这种情况,重复是合理的,造成的高相似度不能判定为围标串标。
好的查重系统需要能够过滤上述场景中的内容,也就是白名单过滤功能。将招标文件作为白名单,投标文件中和白名单相同的内容,在对比之前先进行过滤,
这些能够避免造成不合理的高相似度,防止误导评审人员判断围标串标。
过滤掉干扰因素后,标书查重的相似度才有参考性。相似度单个看意义不大,多个相似度一起看才能发现问题。一批投标书,大家的相似度都是20%左右,
而有两份投标书相似度是40%,那么这两篇标书就应该重点查看,打开对比详情,检查到底是哪些内容相似,相似的地方合不合理,经过人工审查判断后,最终才能做出围标串标的判断。
实际操作过程中,也是根据相似度从高到低的查看,高相似度重点检查,低相似度的根据时间可以放宽检查对比。
标书查重系统可以利用计算机的强大算力,在短时间完成大量文字的对比工作,帮助人节省大量时间,辅助评审人员判断是否有围标串标行为。
Tocheck致力于研究开发文本相似度检测技术,为企事业单位提供标书查重,项目申报/专利查重,员工论文查重,企业信息资产安全保护等多项服务。


1楼2022-12-29 17:12回复