• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

J4 ›› 2012, Vol. 34 ›› Issue (6): 32-37.

• 论文 • 上一篇    下一篇

一种可扩展的格式化文件内容检查方法

高宁1,庞立会2   

  1. (1.中国人民解放军61741部队,北京 100094;2.国防科学技术大学计算机学院,湖南 长沙 410073)
  • 收稿日期:2011-05-04 修回日期:2011-08-03 出版日期:2012-06-25 发布日期:2012-06-25

A Scalable Content Inspection Technology for Files with Formatted Contents

GAO Ning1,PANG  Lihui2   

  1. (1.Corps 61741,Beijing 100094;
    2.School of Computer Science,National University of Defense Technology,Changsha 410073,China)
  • Received:2011-05-04 Revised:2011-08-03 Online:2012-06-25 Published:2012-06-25

摘要:

许多业务应用系统将数据以约定格式存放在文件中,通过文件传输实现远距离业务数据传送和处理。通过分析该类业务应用系统存在的安全威胁,本文首次提出了一种可扩展的格式化文件内容检查方法,设计并实现了格式化文件内容检查的原型系统FFCCIS。FFCCIS使用正则表达式构造内容格式模板,在业务系统的数据处理之前实现文件内容的安全检查,很好地消除了数据文件被恶意篡改、非法文件传递等安全威胁。为了使内容格式模板的构建快速而便捷,本文还给出了一个基于字符串近似匹配技术的内容格式模板自动生成方法。

关键词: 正则表达式, 字符串近似匹配, 格式化文件, 模式自动生成, 可扩展

Abstract:

Lots of business application systems operate to do remote data transmission using files with formatted contents, which are business data. After a detailed analysis of security threats suffered by such an application system, this paper introduces a content inspection technique for files with formatted contents, and designs and realizes FFCCIS(A Content Inspection System for Files with Formatted Contents),which matches file contents with formatted templates in the form of regex expression to inspect tempered or invalid files. An automatic method for generating the content formatted templates is put forward to make the templates write more conveniently and efficaciously.

Key words: regex expression;approximate string matching;files with formatted contents;automatic generating templates;scalable