2007年02期目次

简讯

简讯
2007年02期 16+29+81+118+139+160+164+185+213页 [查看摘要][在线阅读][下载 169K]

农业古籍本体构建及应用
曹玲;何琳;
以农业古籍本体构建为例,从数据选择、构建方法、总体设计几个方面探讨领域本体构建流程,采用Jena实现了对该本体的可视化浏览以及基于自然语言的语义检索。
2007年02期 1-4页 [查看摘要][在线阅读][下载 69K]
《广西师范大学学报:自然科学版》主编易忠教授简介
2007年02期 2页 [查看摘要][在线阅读][下载 36K]
基于句型模板的智能问答系统
唐素勤;李波;许永敏;
智能问答系统是远程教学系统中的一个重要组成部分,其主要功能是解答学习者的提问。在此研究了一种基于句型模板的智能问答系统,实现自然语言提问和自动智能答疑。该系统主要包括三方面的内容:①分析学习者的知识提问形式,采集句型模板,并实现基于Web的提问界面;②通过智能分词和模糊匹配建立提问句型,把提问句型映射到概念-关系模型上;③通过IO模型构造问答结果。
2007年02期 5-8页 [查看摘要][在线阅读][下载 68K]
BP神经网络在住宅区片价评估中的应用
杨小雄;梁燕燕;卢远;冯小丽;
针对传统住宅区片价评估方法的不足,将BP神经网络应用于住宅区片价评估,并将其评估结果与回归分析模型结果进行比较,结果表明基于人工神经网络的评估优于回归分析模型,将神经网络模型应用于住宅区片价的评估是可行的。
2007年02期 9-12页 [查看摘要][在线阅读][下载 74K]
一种基于BMP图像的信息隐藏技术
周开利;康耀红;冯尔理;
提出一种基于BMP图像的信息隐藏技术。BMP图像一个扫描行数据的字节数必须是4的倍数,而实际的BMP图像各行数据的字节数可以不是4的倍数,以这样的图像作为载体图像,将秘密嵌入到并不表示图像数据的字节中,从而实现信息隐藏。该算法不改变图像本身的数据和文件大小,载密图像和原图像在视觉上没有任何差别,具有很强的隐蔽性。按照秘密信息的数据大小,从载密图像中依次读出秘密信息的字节数据,即可恢复秘密信息。仿真结果证明了算法的可行性和有效性。
2007年02期 13-16页 [查看摘要][在线阅读][下载 209K]
自相似性综合业务系统的呼损性能
黄生叶;盘丽娜;
通过对清除阻塞的自相似性综合业务系统进行仿真,分析了系统排队性能。结果表明在清除阻塞机制下,Kaufman递推公式可以推广到服务时间为Pareto分布的自相似性综合业务排队系统以计算呼叫损失概率。
2007年02期 17-21页 [查看摘要][在线阅读][下载 115K]
IPv6中Anycast服务在应用层的分析与设计(英文)
王晓楠;钱焕延;
IPv6以两种方式提供Anycast服务:一种是将Anycast组成员限制在共享一个地址前缀的特殊拓扑区内;另一个是将Anycast地址表示的共享某个特性的结点组分散在互联网的各个地方,这种方式使得路由表会随全球Anycast组数成比例增长,从而构成了Anycast的扩展性问题。提出了一种在应用层实现Anycast服务的解决方案,此方案不仅解决了Anycast服务的扩展性问题,同时也解决了IP层实现Anycast服务所存在的一些其他问题,如路由表膨胀、TCP通信失败等,同时分析和讨论了该方案的可行性及有效性。
2007年02期 21-25页 [查看摘要][在线阅读][下载 210K]
基于蚁群算法的P2P网络路由
王平根;刘勇;周脚根;
对等计算是目前分布计算领域的一个研究热点。对于对等网络系统来说,路由效率是一个关键问题。在此应用蚁群算法到对等网路由中,解决P2P网络的路由问题。仿真实验证实该方法是有效、可行的。
2007年02期 26-29页 [查看摘要][在线阅读][下载 68K]
基于关键词提取的娱乐新闻文档去重算法
沙芸;张国英;孟凡亮;
去除内容相同或相近的新闻是提高搜索引擎的关键技术之一。提出一种基于关键词提取的新闻去重算法,通过以标题为种子点构建词汇链的方法,能够找到对主题贡献大的非高频词,从而抽取出完整文档关键词集合,该方法能够基于小规模语料库识别新词;为了提高网页去重速度和质量,基于关键词建立去重倒排文档。实验结果显示,该方法与传统方法相比排斥错误率降低了5%,去重时间缩短了20%-30%。
2007年02期 30-33页 [查看摘要][在线阅读][下载 72K]
一种新的基于RS和NN的混合数据挖掘算法(英文)
罗飞;
提出一种结合粗糙集理论和BP神经网络理论的新数据挖掘算法。算法利用粗糙集对属性的归约功能将数据仓库中的数据进行归约,将归约后的数据作为训练数据提供给神经网络。通过粗糙集归约,提高了训练数据表达的清晰度,也减少了神经网络的规模,同时利用神经网络又弥补了粗糙集对噪声数据敏感的不足。
2007年02期 34-37页 [查看摘要][在线阅读][下载 158K]
基于Apriori算法的免疫识别规则的挖掘(英文)
张寿华;伊开;李继民;刘振鹏;
GECISM(GEneral computer immune system model)是基于规则匹配检测的计算机免疫系统,免疫识别规则对“自我”和“非我”特征的表征能力直接影响到GECISM的性能,所以挖掘高效免疫识别规则的是GECISM的一个重要研究内容。改进后的Apriori算法以系统调用序列为数据源,从“自我”集和“非我”集中计算出频繁谓词,进而产生免疫识别规则。这些规则反映了“自我”和“非我”的内在特征,是GECISM进行“非我”检测的判据。
2007年02期 38-42页 [查看摘要][在线阅读][下载 166K]
基于SVM的日文网页分类
王清翔;仲婷;潘金贵;
网页分类是使用机器学习算法实现网页类别的自动标注。提出了一种基于SVM的日文网页分类方法,针对日文的特点,设计日文词素词典与规则库,并以此为基础进行日文分词和特征表示,然后使用互信息度进行特征选择,最后应用SVM来构造分类超平面,对日文网页进行分类。最后通过实验进行了验证。
2007年02期 43-46页 [查看摘要][在线阅读][下载 111K]
一个新的无可信PKG的基于身份的数字签名方案(英文)
李蔚;辛向军;张宏伟;
为克服基于身份的签名体制中的密钥管理问题,给出一个新的无可信PKG的基于身份的签名方案。在离散对数问题(DLP)和计算Diffie-Hellman问题(CDHP)困难假设下,它可抵抗适应性选择消息和ID攻击的签名存在性伪造。
2007年02期 47-50页 [查看摘要][在线阅读][下载 154K]
一种有效的图像密写算法(英文)
贵琦;柏森;孙静;
信息隐藏是在不影响载体数据可用性的前提下,将秘密信息隐藏在诸如图像、视频和语音信号等数字多媒体中的一种信息安全技术。提出一种基于变换域容量较大的数字图像密写算法,算法首先将图像在空域进行解相关,之后在变换域进行信息嵌入。通过对图像的解相关可以大大增加变换域的可用系数,也就相应增加了可嵌入的信息量。实验结果表明,算法在达到最大的嵌入信息量时,不但可以保持较高的密写图像质量,而且对于信息量估计法、RS分析法以及Jeremiah提出的直方图分析法都具有很好的抵抗性。
2007年02期 51-55页 [查看摘要][在线阅读][下载 218K]
一种新型动态秘密共享方案
郝蓉;于佳;李国文;
提出一种新型的动态秘密共享方案,提供对子密钥的周期性更新,更新后共享的密钥仍然不变,可以检测恶意成员,对错误子密钥进行恢复,并提供对共享密钥的重构。由于方案采用的是加法共享的方式,所以可以方便地推广到高效动态RSA门限签名方案。
2007年02期 56-59页 [查看摘要][在线阅读][下载 95K]
基于UML的软件构件进化模型
范秉琪;杨新芳;
在统一建模语言UML(Unified Modeling Language)的基础上提出应该从平面关系和进化关系两个方面来支持面向对象软件的开发。平面关系强调以各种视图显示软件构件(包括分析设计模型元素和代码模块)的体系结构;进化关系是指软件构件被引入系统、发展、实现、再扩充直至灭亡过程中的变换关系。提出并详细介绍了基于UML支持环境中的进化模型。进化模型系统描述了进化关系,并支持UML各模型之间的转换和各开发阶段的平滑过渡。
2007年02期 60-64页 [查看摘要][在线阅读][下载 86K]
基于DHT和VSM的Web服务推举策略
刘振鹏;吕宁;张国旭;张雅静;王培;
由于P2P环境的分布式、易拓展等优点,越来越多的Web服务被部署到上面,但是如何在大量返回的结果中进行选择,是Web服务的关键问题。基于分布式哈希表路由算法,并引入向量空间模型相关思想,构建P2P环境中的服务推举网络,提出服务选择的思想和框架。其流程是:发出查询;接收结果(包括推举);进行本地比较,选择最优服务;根据选择的服务,对其进行评估,然后调整相应的模型。这些模型包括服务质量向量和服务推举可信度。最后通过实验对系统的精确性以及动态可调整性进行了验证。
2007年02期 65-68页 [查看摘要][在线阅读][下载 77K]
Web访问挖掘中数据预处理的改进
黄志强;贾宇波;
在分析现有的Web访问挖掘数据预处理模型和会话识别算法的基础上,提出了一种改进的Web访问挖掘数据预处理模型并对基于时间和引用的启发式会话识别算法进行了改进。实验证明,改进的Web访问挖掘数据预处理模型和会话识别算法非常适合于当前搜索引擎广泛使用下的Web访问挖掘数据预处理。
2007年02期 69-73页 [查看摘要][在线阅读][下载 144K]
一种瘦服务器—胖客户分布式搜索引擎的设计
陶跃华;鲁晓南;张玉琢;
传统的集中服务器搜索引擎模式难以满足未来信息检索的需求。为了提高搜索引擎的查全率和查准率,提出一种瘦服务器—胖客户分布式搜索引擎模型,它通过服务器端与客户端协作来共同完成用户的信息检索请求,充分利用各分布式个体的资源,以获得整体最佳的效果。经实验验证此模型有较优的性能。
2007年02期 74-77页 [查看摘要][在线阅读][下载 67K]
基于XML的异构数据交换技术
吴淑雷;雷景生;陈焕东;
在分析异构数据交换技术研究工作基础上,提出了基于XML的异构数据交换模型,并给出了XML和RDB的映射模式。最后以基于XML的试题库模型为例,通过Java Servlet创建异构数据互换的中间件,实现异构数据的交换。
2007年02期 78-81页 [查看摘要][在线阅读][下载 64K]
基于粗糙集理论的项目投资管理(英文)
陈松;曹顺发;王家伟;徐毅;
粗糙集理论是一种新的数据分析和处理方法,使用粗糙集理论可以对决策表进行简化,去除冗余属性。首先给出了基于粗糙集的知识推理方法。然后以一个实际例子讨论如何利用粗糙集理论从现有样本中进行知识约简,获取新决策规则,使该方法具有了实用和推广的价值。
2007年02期 82-85页 [查看摘要][在线阅读][下载 152K]
基于专业搜索技术的在线证券咨询服务系统
章森;王伟;
基于专业搜索技术以及证券行业积累起来的大量数据资料给出了一个用于证券行业的在线咨询服务系统解决方案,讨论了在线证券咨询服务系统的总体架构设计,动态信息和静态信息的获取与分类,个人咨询任务管理模块提供的主要功能,基于语义处理的智能化处理技术等。基于该方案实现的在线证券咨询服务系统e-Consultant已经在多家证券公司内部运行,反映良好。
2007年02期 86-89页 [查看摘要][在线阅读][下载 174K]
企业与内联网信息检索方法概述
富羽鹏;张敏;马少平;
以企业检索为代表的Intranet信息检索是人们所关注的一个新的应用领域。虽然该领域对于信息检索技术的需求很紧迫,也有很大的市场,但是由于与传统的通用信息检索不同,使得通用检索技术无法直接在该任务上加以利用并取得很好的效果。通过阐述以企业信息为代表的Intranet检索的特点和算法,从而揭示Intranet信息检索与传统信息检索的不同之处,并从两个方面给出一些可能的应用和发展的技术方向的展望。
2007年02期 90-98页 [查看摘要][在线阅读][下载 186K]
基于Ontology的Web信息检索方法
程新荣;杨仁刚;康丽;
分析了传统检索技术中存在的问题,即基于关键字的检索忽视了关键字本身所包含的语义信息,导致较低的查全率和查准率。将Ontology应用于信息检索系统改善这种状况,提出了基于Ontology的Web信息检索模型,给出了基于此模型的Web信息检索流程。
2007年02期 99-102页 [查看摘要][在线阅读][下载 64K]
面向专题的智能化中文搜索引擎
陈华;梁循;杨健;
讨论了智能专题搜索引擎的相关设计和实现,通过信息搜索技术、自然语言理解技术、语义网络技术以及数据挖掘技术的引入,改进了传统搜索引擎的搜索结构,进而采用这些技术实现了一个专题搜索的实例。
2007年02期 103-106页 [查看摘要][在线阅读][下载 143K]
基于模糊关联的交互式Web信息检索技术
卢春燕;雷景生;
交互式Web信息检索技术可根据用户反馈信息,调整和修正查询表达式,自动实现查询重构。在此提出一种基于模糊关联的交互式Web信息检索方法,试验结果表明,使用该方法实现查询表达式的重构,可较大幅度地提高Web信息检索系统的查准率。
2007年02期 107-110页 [查看摘要][在线阅读][下载 69K]
多Agent技术在信息检索中的应用
李燕;
从信息检索现状出发,运用人工智能技术,提出一种多Agent的信息检索方法。通过建立用户个性模型,辅助检索Agent在信息提取过程中的精确性,提高系统的个性化和智能化程度。
2007年02期 111-114页 [查看摘要][在线阅读][下载 66K]
一种新的分类评测方法
龚笔宏;
分类算法的现有评价指标存在一些问题,主要是评测数值在不同的数据集上呈现剧烈波动。为解决这一问题,通过考察数据集对分类结果的影响,提出了一种对分类算法的新评测指标new-macro-F1。这一新评测指标将数据集的因素从评测过程中独立了出来,使得new-macro-F1表示的仅仅是分类算法本身。实验结果表明使用新评测指标,同一分类器在不同数据集上的表现波动较小;通过分类器在一个数据集上的表现,可以近似的估计该分类器在另一数据集上的分类质量。
2007年02期 115-118页 [查看摘要][在线阅读][下载 65K]
文本分类的性能评估指标
张启蕊;董守斌;张凌;
在信息检索领域,查全率与查准率是一对相互制约的指标。为了研究文本分类领域查全率和查准率的关系,在此从理论和实验两方面分析查全率及测试集对查准率的影响。理论分析与实验结果一致得出,在文本分类中查全率和查准率是两个一致的指标。另外,在查全率确定的情况下,测试集中各类别文档比例的变化也会导致查准率的变化。
2007年02期 119-122页 [查看摘要][在线阅读][下载 78K]
文本分类系统关键技术
谢科;张辉;陈鹏;庞斌;
从自然语言的角度考虑词性选择,同时从统计学角度考虑删除文档频率过低的特征词,从而避免产生维数灾难,通过考查类别本身特征和类别之间的关系来提取类别特征向量,采用传统夹角余弦公式考查文本与类别的相似度,实现一种过程简单,易于理解且分类效果不错的文本分类系统。
2007年02期 123-126页 [查看摘要][在线阅读][下载 67K]
用聚类-分类模式解决聚类问题
周志勇;袁方;刘海博;
分类和聚类都是常用的数据挖掘方法,分类的优点是准确率较高,但需要带有类别标注的训练集;聚类不需要训练集,但准确率较低。提出一种聚类-分类模式来解决聚类问题,首先通过聚类方法自动形成训练集,然后在训练集的基础上进行分类操作。实验数据表明,提出的聚类-分类模式能够有效提高聚类的准确率。
2007年02期 127-130页 [查看摘要][在线阅读][下载 75K]
基于互信息的Web文档聚类方法
索红光;杨涛;
由于网络信息的激增,如何充分利用大量的信息,并有效地为Web用户服务成为一个急需解决的问题。相关研究表明利用Web文档聚类的方法可以缩小信息检索的范围,提高查询准确率。通过分析Web文档的特征以及常用Web文档聚类方法的优缺点,提出了一种基于互信息理论的Web文档聚类的方法。在聚类的过程中,计算特征词之间的互信息值,根据阈值判断特征词是否属于同一类别。实验结果表明,该方法与K-Means聚类算法相比较,在准确率和召回率方面均有提高。
2007年02期 131-134页 [查看摘要][在线阅读][下载 74K]
基于LSSWM模型的交并式动态扩展聚类算法
陈晓云;王步钰;马友忠;孙辉;
为获取Web上中文人物的精确信息,特别是同名人的分辨,提出了一种基于LSSWM模型的交并式动态扩展聚类算法。通过构建中心词库,对每篇文档建立基于中心距离、中心段、篇章长度等潜在语义信息的语句-词条矩阵LSSWM,利用交并式动态扩展聚类算法,对相似文档进行聚类。实验表明,该算法在保持人物语义信息的连贯性、突出不同位置语义信息重要性的同时,对文档的聚类有较高的准确性。
2007年02期 135-139页 [查看摘要][在线阅读][下载 107K]
一种基于类别核心词的概念映射方法
苑俊英;袁方;刘博;
由于同义词和多义词的存在,使得基于特征词的文本分类方法分类精度不高。近几年,基于概念的文本分类方法得到人们的重视。在此提出一种基于类别核心词的概念映射方法,首先从文本中抽取类别核心词,借助《知网》将特征词映射到基于类别核心词的概念空间,然后在概念空间上完成文本分类工作。实验结果表明,基于类别核心词的概念映射方法及相应的基于概念的文本分类能够有效提高文本分类的精度。
2007年02期 140-144页 [查看摘要][在线阅读][下载 109K]
基于同义词词林的中文文本主题词提取
程涛;施水才;王霞;吕学强;
中文文本主题词的提取可以浓缩一篇文章,可以提炼一个中文网页,还可以帮助实现网上广告与网页的精确匹配。提出了一种基于同义词词林的中文文本主题词提取方法,不仅考虑了传统的影响主题词语权重的因素,还考虑到了同义词、相关词以及下位词的出现对于词语权重的影响。实验表明,用该方法对中文文本
2007年02期 145-148页 [查看摘要][在线阅读][下载 61K]
一种基于块分析的网页去噪音方法
刘晨曦;吴扬扬;
一张网页通常由许多信息块组成,除了主题内容块以外,还常常包含广告信息、导航条、版权信息等信息块。结合网页块大小、位置等信息以及网页本身的一些特点,提出了一种基于块分析的、自动调整阈值的去除噪音方法,该算法显著减少了网页的噪音,并通过网页分类对比实验证明了该算法的有效性。
2007年02期 149-152页 [查看摘要][在线阅读][下载 99K]
基于Map/Reduce的网页消重并行算法
张元丰;董守斌;张凌;陈晓志;
网页消重模块是搜索引擎系统的重要组成部分,其作用是对搜索引擎的爬虫系统下载的网页进行过滤,去除重复内容的网页,从而提高搜索引擎爬虫系统的性能和检索的质量。提出了一种网页消重的并行算法以及基于Map/Reduce的实现机制,并通过实际网站的实验验证了该消重算法的稳定性和处理大量网页时的并行性能。
2007年02期 153-156页 [查看摘要][在线阅读][下载 79K]
层次化话题发现与跟踪方法及系统实现
邱立坤;龙志祎;钟华;程葳;
自1996年话题发现与跟踪评测启动以来,该研究受到普遍关注,取得巨大进步,也遇到诸多困难。通过分析大量话题数据,提出层次化话题与层次聚类的区别在于话题的层次是由事件的构成决定的,层次化话题应当分为三层,即微类、中类和上类。原因在于计算机自动分析产生的层次化话题必须与现实世界有客观的联系。据此提出一个面向大规模真实数据的有充分理论依据的层次化话题发现与跟踪方法,并在集群系统上予以实现。
2007年02期 157-160页 [查看摘要][在线阅读][下载 63K]
基于相邻词的中文关键词自动抽取
王灿辉;张敏;马少平;黄宇;
文档关键词概括了文档的主题和内容,在信息检索、文本分类、文本聚类等领域有着重要应用。在总结前人研究成果的基础上,提出了一种基于相邻词的中文关键词自动抽取算法。在对50篇学术论文自动抽取关键词的实验中,采用精确匹配的评价获得了38.9%的精度和34.9%的召回率,采用近似匹配的评价获得了70.7%的精度和68.8%的召回率,能够为进一步的研究提供帮助。
2007年02期 161-164页 [查看摘要][在线阅读][下载 72K]
基于混合策略的中文文摘自动评测方法
闫英杰;林鸿飞;王剑峰;
评测是自然语言处理技术研究与发展的一个关键部分,同时也是最有争议的一个部分。作为自然语言处理范畴的中文文摘自动评测,较之英文文摘,有着更多的难点问题。在研究当前基于内容比较策略和基于数理统计策略两类自动文摘评测方法的基础上,提出了混合这两种策略的中文文摘自动评测方法,并通过两组不同实验验证了该评测方法的正确性与实用性。
2007年02期 165-168页 [查看摘要][在线阅读][下载 67K]
基于中文Web社会网络的提取、测量与分析
邸楠;姚从磊;李晓明;
从中文Web中提取人名实体,设计了3种人物间关系定义,并以此为基础构建一个人物间关系网络。通过计算一些社会网络研究中常用的属性指标,验证了社会网络中的一些常见现象,例如“小世界现象”。对社会网络的分析工作包括两个方面:一方面,使用主成份分析来帮助划分人物关系网络,并将划分结果与对应的人物属性相比较,结果表明人物职业较之籍贯和性别等属性更符合来自Web社会网络中的结构划分;另一方面,根据人名在Web中热点程度排序,并按照顺序依次选择3组不同大小的人物列表分别构建社会网络,以此来观察随着人物的增加该社会网络的演化现象,并发现构建的人物关系网络结构是一个单核心的网络。
2007年02期 169-172页 [查看摘要][在线阅读][下载 119K]
中文网页体裁分类特征项的权值调整策略
黄臻臻;吴扬扬;
研究了中文网页体裁分类的特征项选取问题及权重计算方法,探讨不同特征空间对体裁类别的判别能力问题,给出了一种评价方法。据此,提出一种特征项的权值调整策略,实验结果验证了该方法的有效性。
2007年02期 173-177页 [查看摘要][在线阅读][下载 98K]
分布式大规模文本检索系统
李智超;熊风;富羽鹏;马少平;
阐述了一个分布式大规模文本检索系统的结构和工作原理,并且基于TREC 2006的数据进行实验,得出了分布式检索系统具有有效性和高效性的结论。
2007年02期 178-181页 [查看摘要][在线阅读][下载 75K]
基于图像内容检索的主题爬虫设计方法
张磊;林坤辉;周昌乐;毛红朝;
图像主题爬虫能获取网上特定主题的大量图像信息,对专业搜索引擎及数据挖掘应用都具有重大价值。针对目前基于图像内容检索主题爬虫的不足,提出了一种图像主题爬虫的设计方法,设计了一种新的爬虫系统框架,采用了基于颜色累加直方图的方法进行图像的特征提取与特征匹配。最后提出了优化爬虫的方法,改进爬虫的搜索策略,提高了爬虫的搜索效率。
2007年02期 182-185页 [查看摘要][在线阅读][下载 64K]
一种基于度量距离学习的图像检索方法
罗辛;邰晓英;SHISHIBORI Masami;KITA Kenji;
CBIR系统由于受图像低层特征的限制,制约了它的检索效果。机器学习和统计方法是一种有效的提高检索性能的方法,但通常需要大量的训练样本才能达到满意的检索精度。提出一种理想的距离度量函数,在对图像进行简单分类并提供少量训练样本的基础上,通过类的距离度量矩阵M的学习来考虑分量之间的相关性。这个度量导入二次最佳化问题的解,将训练样本类结构的倾斜最小化。试验结果表明,该方法能在学习样本极少的情况下提高检索的性能。
2007年02期 186-189页 [查看摘要][在线阅读][下载 81K]
基于DCT系数分布的含密图像识别算法(英文)
刘一均;柴毅;柏森;郭茂耘;
提出了一种基于DCT系数统计分布的含密图像(stego-images)和掩护图像(cover-images)的识别算法。实验表明:该算法能快速识别各种JPEG和BMP格式的基于变换域和空间域的含密图像和非含密图像,并且优于其他含密图像识别方法。
2007年02期 190-193页 [查看摘要][在线阅读][下载 179K]
基于高斯曲率改进的PM模型
辛巧;闫萍;盛其荣;
在Perona和Malik的各项异性扩散方程的消噪模型中,一些小梯度的细节信息和噪声会被扩散掉,而在这些细节信息点往往具有零高斯曲率的特征,根据这一特点,对PM模型加以改进。新的模型不但可以保持零高斯曲率的图像特征,如:直线边缘、曲线边缘、角点、斜坡和小尺度特征,还可以增强尖锐的边缘。实验表明,改进的模型比PM保留了更多的图像信息,因此该模型可以大量地应用于图像处理和计算机视觉。
2007年02期 194-197页 [查看摘要][在线阅读][下载 324K]
IFS系统在植物形态模拟中的应用
张文辉;周萍;
IFS系统是模拟植物形态的一门重要技术。首先分析迭代函数系统中IFS码产生原理,阐述IFS如何模拟植物形态,然后依据拼贴定理,研究IFS码的变换特点,并利用IFS码的连续性探讨IFS码变换的规律及表现效果。另外通过增加IFS码,对分形图进行变换,逼真模拟森林、草地等自然景观。
2007年02期 198-201页 [查看摘要][在线阅读][下载 297K]
求解单圈多部图的匹配算法
钟声;云敏;焦安全;
给出了一个多部图及其匹配问题的定义,提出了求解单圈多部图匹配问题的一个算法。该算法提出多部图顶点间的可达性定义,并使用试探与缩小规模相结合的方法以及求二部图的最大匹配算法,求解单圈多部图的最大匹配问题。经过验证,算法的效率比较高。
2007年02期 202-205页 [查看摘要][在线阅读][下载 87K]
一种改进的贝叶斯文本分类方法
张玉芳;陈剑敏;熊忠阳;
朴素贝叶斯分类(naive Bayes)有一个“独立性假设”:给定一个实例的类标签,实例中的每个属性的出现都独立于实例中其他属性的出现,而在实际应用中这种条件并不易满足,另外由于文本的特殊性,相关的特征项可能会产生新的语义信息。因此在训练文本时,对特征选择后产生的特征集用一种可行的方法考察它们之间的相关性,然后对相关程度高的特征进行合并处理。实验数据表明,这个改进的方法能提高朴素贝叶斯的算法精确度。
2007年02期 206-209页 [查看摘要][在线阅读][下载 74K]
轻量级自适应搜索引擎的设计与实现
孙志东;潘懋;孙知信;闫秋艳;
介绍一种建构在PC Windows平台上的轻量级自适应搜索引擎的设计方案,实现了WIC原型系统,它主要由网络搜索器、网页索引器、检索器和用户交互界面等部分组成。同时,针对传统搜索引擎的静态特性等缺陷,采用了基于用户交互的反馈排序技术,使WIC能够动态调整,具有一定的自适应能力。最后,通过实验证明了系统的可行性及其优点。
2007年02期 210-213页 [查看摘要][在线阅读][下载 72K]
一种基于结构分析的改进HITS算法
仲婷;金浩;冯茜芦;潘金贵;
Web挖掘技术的应用之一就是Web搜索引擎。对于搜索引擎中的Web结构挖掘,通过对经典的超链接分析算法的研究,对Web超链结构进行深入分析的基础上,针对HITS算法的缺陷,通过引入权值和调整因子对其进行改进。实验表明,改进后的算法表现更加出色。
2007年02期 214-217页 [查看摘要][在线阅读][下载 116K]
基于Ultra Search的桌面搜索设计与实现
于江德;樊孝忠;尹继豪;
提出一种基于Ultra Search的桌面搜索设计和实现方案,简要介绍了Ultra Search体系架构和各个组件的功能,然后给出该桌面搜索的框架和各个组件的实现细节,并和多个桌面搜索工具在相同的数据源上进行测试,结果表明,该桌面搜索有不错的搜索性能。
2007年02期 218-221页 [查看摘要][在线阅读][下载 76K]
专业搜索引擎数据更新的算法P~2FC
刘辉林;孟莉;杨松波;王光兴;
网页更新策略的好坏直接影响到专业搜索引擎的整体性能。在分析了专业搜索引擎中网页更新模块结构和它所采用的监控技术的基础上,考虑了重要性、时新性、估计频率、点击率等综合因素,提出了一种新的增量式更新算法P2FC。实验证明,该算法在保证时新性和提高更新效率上都取得了很好的效果。
2007年02期 222-225页 [查看摘要][在线阅读][下载 82K]
基于XML索引动态分组的P2P信息检索机制
蒙应杰;马生峰;蒋凯元;葛远庭;郭喜平;
针对中心服务器P2P存在瓶颈和单点失效以及无结构P2P易产生网络阻塞的问题,提出一种基于XML索引动态分组的P2P信息检索机制,解决了P2P系统多层次分组不能及时更新以及分组依据片面性的问题。方案中基于发掘用户兴趣设计了动态分组的IBDG算法,该算法通过实时更新分组提高了搜索效率。仿真实验结果证明该算法有效。
2007年02期 226-229页 [查看摘要][在线阅读][下载 118K]
基于用户群的智能主题爬虫
赵燕;陈晓云;莫明辉;汤勇;
提出一个基于用户群的智能主题爬虫系统CITC。它首先对用户群日志进行挖掘,得到相应的知识库。在知识库的指导下,CITC采用多重选择策略,对网页进行选择性爬取。实验结果表明,此系统能够基于用户群兴趣有效地抓取目的网页。
2007年02期 230-233页 [查看摘要][在线阅读][下载 70K]
2007年粗糙集与软件算、Web智能、粒计算联合学术会议征文通知
2007年02期 234页 [查看摘要][在线阅读][下载 16K]

下载本期数据

广西师范大学学报（自然科学版）

简讯