使用C# 的web架构,界面简洁大方,后台查重计算使用多线程加快计算速度。 解析word文件的文本内容,对文字进行查重,结果展示重复段落,重复率等指标
功能说明:
a. 检测标准按照段落和句子做匹配,每个句子如果超过连续13个字(可在后台设置)重复,则认为该段落是重复的。
b. 段落以回车换行符来标识。
c. 上传文件为word格式。
d. 在结果展示页面,列出所有重复的段落,重复的句子用红色标识。
e. 文件估计一般几十M,查询方法需优化,如果查询时间过长,应使用后台任务做计算。
f. 前端在浏览器中运行,后台环境为windows服务器,开发工具为c# net,不使用数据库,用户不需要登录,后台不需要记录查询历史,只做计算。