比如“斑竹”本应该是“版主”,由于人们经常误打,后来干脆将错就错,正式使用“斑竹”这个称呼了。

        陈岩提醒道:“发现问题了吧?遇到错别字,松江府不能识别,也就无法进行应答,这可不能适应互联网的实际需要啊。”

        “你说得对,但这个问题有点难办。”李松有些苦恼:机器学习的前提,是依据正确的材料,不断进行自我提升。网上的大量文章,要是也像聊天那样经常包含错别字,那非把松江府带沟里去不可。

        但是这个问题又必须解决,聊天环境毕竟跟正儿八经写文章不同,不能要求太高。

        接下来的两天,李松研究出了一个“关键词匹配”的方案:遇到疑似错别字,如果在替换成读音相近的关键词后,语义上说得通,那就按关键词理解。

        随后,李松邀请陈岩进行第三次测试。

        当陈岩说“想去余元商城买个手掌”时,松江府反问道:“@陈岩,你是想去豫园商城吧?还有,手掌是不能买的,你说的是手杖吧?”

        这回陈岩不得不老实承认:“哦对,是我打错了字。”

        松江府热情地介绍:“今天豫园商城附近不堵车,那边有很多卖手杖的店铺,百年老店‘鹤轩礼品店’信誉很好,你不妨去看看。”

        “好的,多谢。”

        内容未完,下一页继续阅读