I3S Stream Scan主要利用特征串匹配技术进行特定串的扫描。所谓串匹配(string matching,pattern matching),就是在任意的一个字符串(text)中找出一个(或一组)特定字符串(string,pattern)的所有出现位置。例如在文本“Beijing_Olympics_2008_One_World_One_Dream”中搜索字符串“World”就是一个串匹配问题。
>
> 串匹配是计算机研究领域的一个经典问题,是许多应用系统的核心技术之一。在现实生活中,串匹配技术的应用十分广泛,其主要应用领域包括:入侵检测、病毒检测、信息检索(搜索引擎)、计算生物学、金融监测,等等。在许多应用系统中,特征串的匹配所占的时间比重相当大(高达60-70),串匹配算法的速度很大程度上影响着整个系统的性能。
>
> 对于串匹配算法的研究,已经有三十多年的历史,计算机科学家们提出了很多优秀的算法(如Aho-Corasick算法、Wu-Manber算法等)。但是,近年来,随着网络带宽的指数增长,网络系统中需要处理的数据量越来越大;同时,系统中待匹配的特征串也越来越多,已经达到几千和上万的规模。面对日益增长的网络流量和特征串规模,现有的串匹配算法的处理能力越来越不敷应用。
>
> 中科院计算所多年来一直进行串匹配算法方面的研究,取得了丰硕的成果。与此同时,经过多年的开发积累,形成了一套完善的串匹配算法库I3S Stream Scan,在十几个项目中得到广泛使用,运行稳定,性能优越,算法速度是国际公认算法速度的3-4倍,产生了巨大的经济和社会效益,得到了用户的高度肯定。