(一)自动聊天脚本的核心技术有两部分:
①聊天内容的识别
常用实现技术分为:节点xml中提取文字和文字图像ocr识别
大部分聊天app基本都可以使用xml提取技术实现,但是也有例外比如微信,它的节点xml中不包含聊天内容,另外游戏类APP也不能用xml方式
图像ocr识别没有限制,但是它也有缺点,识别率不能做到100%准确,识别速度也相对较慢。
②话术库的匹配
我们识别出聊天内容后,要给出相应的回复话术,所以就需要有话术库。
话术库一般有两类:自建话术库和智能聊天api
通常自建话术库至少包含两部分核心内容:关键词和对应的回复内容
关键词:触发回复的文字,比如有人私信我“教程”这两个字,我就会发一个教程下载地址,那么“教程”就是关键词。
使用关键词匹配的好处就是可以模糊匹配,比如对方聊天内容是基础教程,里面包含了教程两个字,同样也可以匹配成功。
回复内容:和关键词相对应的一段话。
自建话术库可以是文本,可以是本地数据库,也可以是服务器上的数据库,只要能存储关键词和对应回复内容的容器都可以。
自建话术库的匹配逻辑:先遍历所有关键词,让它与获取到的聊天内容进行匹配,匹配方式可以是“相同”、“包含”、“被包含”,如果匹配成功,调取和关键词相对应的话术内容,把话术内容发送出去。
大部分自建话术库在刚开始都做不到包含所有关键词,所以需要逐渐完善。
智能聊天api就是别人编写的话术库,优点是关键词更多,基本可以做到100%匹配,缺点是匹配的话术有可能会出现前言不搭后语的回复内容。
①聊天内容的识别
常用实现技术分为:节点xml中提取文字和文字图像ocr识别
大部分聊天app基本都可以使用xml提取技术实现,但是也有例外比如微信,它的节点xml中不包含聊天内容,另外游戏类APP也不能用xml方式
图像ocr识别没有限制,但是它也有缺点,识别率不能做到100%准确,识别速度也相对较慢。
②话术库的匹配
我们识别出聊天内容后,要给出相应的回复话术,所以就需要有话术库。
话术库一般有两类:自建话术库和智能聊天api
通常自建话术库至少包含两部分核心内容:关键词和对应的回复内容
关键词:触发回复的文字,比如有人私信我“教程”这两个字,我就会发一个教程下载地址,那么“教程”就是关键词。
使用关键词匹配的好处就是可以模糊匹配,比如对方聊天内容是基础教程,里面包含了教程两个字,同样也可以匹配成功。
回复内容:和关键词相对应的一段话。
自建话术库可以是文本,可以是本地数据库,也可以是服务器上的数据库,只要能存储关键词和对应回复内容的容器都可以。
自建话术库的匹配逻辑:先遍历所有关键词,让它与获取到的聊天内容进行匹配,匹配方式可以是“相同”、“包含”、“被包含”,如果匹配成功,调取和关键词相对应的话术内容,把话术内容发送出去。
大部分自建话术库在刚开始都做不到包含所有关键词,所以需要逐渐完善。
智能聊天api就是别人编写的话术库,优点是关键词更多,基本可以做到100%匹配,缺点是匹配的话术有可能会出现前言不搭后语的回复内容。