专利内容由知识产权出版社提供
专利名称:一种文件摘要的提取方法专利类型:发明专利发明人:赵树乔
申请号:CN201110375121.0申请日:20111123公开号:CN1023458A公开日:20120229
摘要:本发明涉及一种文件摘要的提取方法,属于数据处理技术领域。首先生成一个由多个字节组成的字节序列,将文件按照单位长度切分为一个或多个数据块,扫描组成各数据块的字节取值,将该字节取值与字节序列中各字节取值进行比较,统计两者相等的字节数量;设定一个数量分隔符,检查字节数量的符号,当字节数量符号超过一个时,在其两侧添加该数量分隔符,将所有字节数量和数量分隔符组成一个或多个中间序列;设定边界分隔符,将多个中间序列依次相互连接,每两个中间序列之间添加上述边界分隔符,得到文件摘要。本发明方法可以根据摘要值迅速判断出两个文件的相似程度,在没有得到原始文件数据的情况下,也可以得出不同原始文件的相似程度。
申请人:赵树乔
地址:100101 北京市朝阳区南湖南路9号
国籍:CN
代理机构:北京清亦华知识产权代理事务所(普通合伙)
代理人:罗文群
更多信息请下载全文后查看