广西师范大学学报(自然科学版)

第二十四届全国信息检索学术会议专栏

  • 基于沪深300成分股的量化投资策略研究

    吕凯晨;闫宏飞;陈翀;

    本文以沪深300指数成分股为股票池,构建出一个能持续战胜市场的量化选股模型。第一步先从基本面入手,通过多因子打分模型筛选出50只长期优势股,对应的上市公司经营状况良好,具有一定投资价值,但短期内可能受市场震荡影响,未必在一周之内有上涨表现。在第二步引入支持向量分类算法对长期优势股展开技术分析,从中选出本周上涨概率最大的10只优势精选股买入。该模型在2015—2017年累计收益率达73.03%,年化收益率为20.05%,夏普比率为0.54,远超同期沪深300指数的业绩表现。

    2019年01期 v.37 1-12页 [查看摘要][在线阅读][下载 3340K]
  • 基于循环神经网络和深度学习的股票预测方法

    黄丽明;陈维政;闫宏飞;陈翀;

    本文提出一种基于多路循环神经网络与深度学习的股票预测方法。针对股票的涨跌预测问题,使用分布式向量表示方法提取出股票相关的新闻文本特征,同时考虑到股票相关信息的时序性以及新闻影响的持续性特质,使用多路循环神经网络模型对所提取的特征与交易信息进行协同训练,从而获得历史信息的低维向量表示。最后将多个循环神经网络的输出进行拼接,利用深度神经网络共同对股票的涨跌进行分类预测。本文使用上证A股的价格与新闻数据进行实验,实验结果表明,本文所提出的方法在股票预测任务上具有明显的优越性。

    2019年01期 v.37 13-22页 [查看摘要][在线阅读][下载 2260K]
  • 基于词聚类的跨媒体突发事件检测方法

    刘金龙;郭岩;余智华;刘悦;俞晓明;程学旗;

    本文提出一种基于突发词聚类的跨媒体突发事件检测方法。根据事件分析,发现微博具有文本丰富、用户活跃度高、在突发事件检测中具有速度快且高效的特点,但是由于微博文本长度较短,内容过于随意,使得事件发现的结果不够精确。新闻作为官方媒体,其真实性和权威性较高,内容比较规范,事件发现较为准确,但因为新闻数量较少,对于突发事件检测任务来说,时效性较低。现有的方法只针对一种媒体的数据进行挖掘,无法规避掉该媒体的数据所固有的缺点。本文提出一种方法,将微博和新闻2种媒体的数据进行融合,在满足突发事件检测的时效性的同时,提升了突发事件检测的准确率。

    2019年01期 v.37 23-31页 [查看摘要][在线阅读][下载 4973K]
  • 基于高层语义注意力机制的中文实体关系抽取

    武文雅;陈钰枫;徐金安;张玉洁;

    实体关系抽取在挖掘结构化事实的信息抽取系统中扮演着重要的角色。近年来,深度学习在关系抽取任务中取得了显著的成果,同时,注意力机制也逐步地融入到神经网络中,进一步提高了关系抽取的性能。但是,目前的注意力机制主要关注一些低层次的特征,比如词汇等。本文提出一种基于高层语义注意力机制的分段卷积神经网络模型(PCNN_HSATT,high-level semantic attention-based piecewise convolutional neural networks),该模型将注意力机制设置在分段最大池化层后,动态地关注了高层次的语义信息。除此之外,由于中文实体关系语料稀疏性较大,本文利用同义词词林对COAE2016语料进行增强以扩大数据规模。最后在COAE2016和ACE2005的中文语料上进行实验,F1值分别达到了78.41%和73.94%,与效果最好的SVM方法相比分别提高了10.45%和0.67%,这充分证明了PCNN_HSATT模型在中文关系抽取上的有效性。

    2019年01期 v.37 32-41页 [查看摘要][在线阅读][下载 595K]
  • 基于多任务深度学习的文本情感原因分析

    余传明;李浩男;安璐;

    多任务学习利用不同任务之间的相似性辅助决策,与单任务学习相比,多任务学习能够利用更多的信息,从而可以弥补单任务学习信息利用不足的缺陷。本文选择NTCIR-ECA数据集中的中文和英文文本数据作为实验数据,以情感原因分析作为研究任务,提出了一种结合多任务学习和深度学习的模型MTDLM(multi-task deep learning model),实现不同语种下的情感原因分析。实验结果表明,在数据不平衡的情况下,MTDLM模型对英文语种的情感原因识别的最优F值为39%,优于单任务学习(F值为0)和传统基线模型(LR的F值为33%),从而验证了模型的有效性。

    2019年01期 v.37 50-61页 [查看摘要][在线阅读][下载 422K]
  • 基于损失函数融合的组排序学习方法

    林原;刘海峰;林鸿飞;许侃;

    排序学习已经在信息检索和机器学习领域中获得了广泛的关注,一系列的排序学习理论主要是基于3种排序样本构造方法提出的,分别是:单文档方法(pointwise)、文档对方法(pairwise)、文档列表法(listwise)。特别地,文档列表法中的组排序的方法可以有效地提高排序的性能。将这些方法与损失函数相结合来提高组排序的性能,基本思想是融合不同的损失函数来扩充基于神经网络方法的损失函数。首先,本文提出了一种基于J氏距离(Jeffrey’s divergence)的组样本损失函数的构造方法;然后,基于该组排序的方法,提出了一种与其他损失函数进行融合框架,在LETOR3.0数据集上比较了所提出方法的性能;最后,实验结果表明所提出的加权损失函数融合方法能够有效地提高查询的相关性排序结果。

    2019年01期 v.37 62-70页 [查看摘要][在线阅读][下载 180K]
  • 基于深度自动编码器的多标签分类研究

    聂煜;廖祥文;魏晶晶;杨定达;陈国龙;

    在多标签分类的相关研究中,由于现有的基于网络表示学习算法的相关方法只利用了网络中节点之间的邻接领域信息,而没有考虑到节点之间的结构相似性,从而导致分类准确性较低,因此,本文提出一种基于深度自动编码器的多标签分类模型。该方法首先利用轨迹计算算法(Orca)计算不同规模下网络中节点的结构相似性,作为深度自动编码器的输入来改进隐藏层中的向量表示,保留网络的全局结构;然后利用节点的邻接领域信息在模型中进行联合优化,从而能有效地捕捉到网络的高度非线性结构;最后根据隐藏层得到节点的向量表示,利用支持向量机对节点进行多标签分类。验证实验采用3个公开的网络数据集,实验结果表明,与基准方法相比,本文方法在多标签分类任务中能取得更好的效果。

    2019年01期 v.37 71-79页 [查看摘要][在线阅读][下载 1468K]
  • 基于循环胶囊网络的临床语义关系识别研究

    王祺;邱家辉;阮彤;高大启;高炬;

    得益于医疗信息化的不断推进,医院已积累了大量的电子病历记录。然而,这些病历记录大多以自然语言的形式存在,无法为计算机所"理解",也就无法对其做进一步的处理与挖掘。由此,对病历文本进行结构化研究,识别出病历实体间的语义关系,便显得尤为重要。本文针对临床语义关系识别任务,提出循环胶囊网络模型,使用分段循环神经网络来捕捉两实体及其上下文信息,并使用胶囊网络来进行最终的关系分类。实验表明,本文提出的方法较现有监督学习方法取得了更好的识别效果(F1-score为96.51%),证明了本文方法的优越性。

    2019年01期 v.37 80-88页 [查看摘要][在线阅读][下载 1224K]
  • 汉语-印尼语平行语料自动对齐方法研究

    郑铿涛;林楠铠;付颖雯;王连喜;蒋盛益;

    双语平行语料库是多语种自然语言处理的重要资源,已被广泛地应用于机器翻译、机助人译、翻译知识抽取与跨语言信息检索等领域中。本文针对汉语-印尼语平行语料的自动对齐与可比语料的自动提取问题,提出了基于锚点和词典相结合的段落对齐方法,并在此基础上采用基于置信区间的长度模型实现句子对齐,同时,为了快速提高汉语-印尼语平行语料库的构建效率,还提出了基于跨语言文档相似度的可比语料提取方法。实验结果表明,本文提出的平行语料对齐方法和可比语料提取方法的准确率较传统方法有显著的提高,说明本文提出方法是有效的、可行的。

    2019年01期 v.37 89-97页 [查看摘要][在线阅读][下载 860K]

  • 政策影响下的私家车出行率变化研究——以广州市为例

    胡郁葱;谢昳辰;黄靖翔;

    本文研究不同政策下私家车出行率的变化情况,为减少私家车出行率的政策制定提供理论依据。结合广州市的实际情况,设计基于SP和RP调查方法的问卷,设定多因素同时变化的情境,对广州市已经拥有私家车的市民和近期计划购买私家车的市民进行随机访问调查。首先对被调查人群进行聚类分析后建立各种不同出行情况的二项Logit选择模型;然后通过模型计算得到政策变化情况下的居民出行率的变化;最后得到选择私家车进行上下班出行的平均出行次数受各因素变化影响最大,通勤出行者对燃油费用的敏感性大于公交发车间隔和停车费等的结论。

    2019年01期 v.37 98-105页 [查看摘要][在线阅读][下载 1365K]
  • 基于差分进化算法SVM的公交通勤乘客识别

    吕攀龙;翁小雄;彭新建;

    通勤乘客是在早晚高峰出行并具有一定出行规律的人群,准确地从公交刷卡数据中识别通勤人群,对采取措施缓解早晚高峰交通拥堵和整个城市公交线网规划和调整具有重要意义。本文以珠海市公交IC卡数据为依托,提出一种基于差分进化算法优化支持向量机(SVM)的公交通勤识别方法。首先通过通勤乘客调查和实际刷卡数据相结合,分析出通勤乘客出行的特征属性;然后采用SVM算法构建分类识别模型,并利用差分进化算法(DE)对SVM进行参数寻优,得到最优识别模型,其识别准确率高达94.28%,优于其他算法模型;最后利用该模型对珠海公交IC卡数据中的通勤人群进行识别,结果显示其公交通勤人数为178 259人,占公交出行总人数的21.47%。

    2019年01期 v.37 106-114页 [查看摘要][在线阅读][下载 1839K]
  • 网络的平均度和规模对部分同步状态的影响

    李珏璇;赵明;

    本文从序参量和复杂度2个角度考察网络的平均度和规模对网络的部分同步状态的影响。结果表明,无论对于度分布比较均匀的随机网络、小世界网络还是度分布异质性比较强的配置无标度网络,只有在网络处于部分同步状态时,平均度才对序参量有显著的影响:平均度的增加使得3种网络的部分同步状态变好,相应的序参量变大;在不同的耦合强度区域,复杂度表现出不同的变化规律。当耦合强度较小时,随着网络规模的增加,网络部分同步状态变差,相应的复杂度变小。而对于规则的近邻耦合网络,网络平均度的增加使得网络的同步状态变好、复杂度增加,而网络规模的增加则使得网络的同步状态变差、复杂度减小。

    2019年01期 v.37 115-124页 [查看摘要][在线阅读][下载 5465K]
  • 低温度系数高电源抑制比宽频带带隙基准电压源的设计

    连天培;蒋品群;宋树祥;蔡超波;庞中秋;

    本文设计了一款低温度系数高电源抑制比的带隙基准电压源。设计采用动态阈值MOS管(DTMOS)产生温度补偿电流,以降低温漂;输出部分采用一个简单的低通滤波器,以降低高频噪声,在较宽频带内提高电源抑制比。电路采用SMIC 0.18μm标准CMOS工艺实现,供电电源为1.8V,仿真结果表明:电路在-40~130℃温度范围内,温度系数为1.54×10-6℃-1,输出基准电压为1.154V,电源抑制比在10Hz处为-76dB,在100kHz处为-85dB,在15 MHz处为-63dB。本基准源具有较好的综合性能,可为数模转换电路、模数转换电路、电源管理芯片等提供高精度的基准电压,具有较大的应用价值。

    2019年01期 v.37 125-132页 [查看摘要][在线阅读][下载 1873K]
  • 基于网络结构和潮流追踪的电网关键节点识别

    邹艳丽;姚飞;汪洋;王瑞瑞;吴凌杰;

    本文综合电网拓扑结构和基于潮流追踪技术,提出一种关键节点识别方法。首先根据潮流运算,得到电力网络中节点之间的潮流流向,然后对电力网络进行潮流追踪运算,得到节点之间的链接强度,并以此建立电网的加权有向网络模型,定义加权有向网络中的出、入强度,根据节点强度和负荷权重定义节点的重要性评价指标。以IEEE39节点系统和IEEE14节点系统为测试案例,得到各系统中节点的重要性排序。按照排序结果对节点进行过负荷攻击,以系统在节点受到攻击后潮流熵的变化来验证节点重要度排序是否合理,研究表明本文提出的方法在电网关键节点识别中更加合理有效。

    2019年01期 v.37 133-141页 [查看摘要][在线阅读][下载 1370K]
  • 具有两类上限条件的虚拟样本生成数量优化

    林越;刘廷章;王哲河;

    面对小样本数据集,虚拟样本生成(virtual sample generation,VSG)技术已被证实能有效提升机器学习算法的性能,然而对于最优的生成数量并未有明确的结论。本文首先在给定训练样本标准方差上限的条件下,采用信息熵理论研究最优虚拟样本生成数量;其次将虚拟样本所产生的噪声加以考虑,在给定的置信水平(0.95)下建立了最优虚拟样本生成数量的一般概率模型及分析方法;最后以2016年浙江湖州某变电站历史监测故障数据建立小样本数据集,设计4次相关虚拟样本生成实验,结果表明,上述两种最优虚拟样本生成数量法则行之有效,相应的机器学习预测精度有所提高。

    2019年01期 v.37 142-148页 [查看摘要][在线阅读][下载 192K]
  • 几乎SS-嵌入子群对有限群p-幂零性的影响

    吕玉博;韦华全;李敏;

    称子群H为在有限群G中几乎SS-嵌入的,如果存在G的s-拟正规子群T使得HT在G中s-拟正规且H∩T≤HseG,其中HseG为包含于H的G的所有s-拟正规嵌入子群生成的群。记Md(P)={P1,P2,…,Pd}为素数幂阶群P的极大子群的集合,满足∩di=1Pi=Φ(P)。本文考察了Md(P)中元素具有上述性质时对有限群p-幂零性的影响,并推广了若干相关的新近结果。

    2019年01期 v.37 149-154页 [查看摘要][在线阅读][下载 171K]
  • FI-gr-内射模

    刘天莉莲;王芳贵;高增辉;

    本文引入了FI-gr-内射模及强FI-gr-内射模的概念,并说明它们与分次内射模之间的相互关系。证明了分次环R是分次QF环当且仅当每个分次模是强FI-gr-内射模;设R为左分次凝聚环,则l.FP-gr-dim(R)≤1当且仅当每个FI-gr-内射模是分次内射模。此外,还证明了l.gr-fiD(R)=sup{gr-pd(L)|L为FP-gr-内射模}。

    2019年01期 v.37 155-164页 [查看摘要][在线阅读][下载 210K]
  • 团簇Ni_3CoP催化析氢活性研究

    李历红;方志刚;赵振宁;陈林;韩建铭;崔远东;马填棋;姜雨晨;

    基于密度泛函理论(density functional theory,DFT),在B3LYP/lanl2dz水平下对团簇Ni3CoP的初始构型进行单、三重态下的计算得到优化构型,依据前线轨道理论(frontier molecular orbital theory,FMO)着重通过分析前线轨道图以及比较前线轨道能级差对团簇Ni3CoP催化水析出氢气时的反应机理进行理论研究,结果表明:团簇Ni3CoP通过其最高占据分子轨道(highest occupied molecular orbital,HOMO)与水分子最低未占分子轨道(lowest unoccupied molecular orbital,HUMO)间的电子流动完成氢原子的吸附,且三重态构型在与水分子作用时,其β-HOMO轨道在反应中起主导作用。三重态构型在吸附氢原子后其促进解吸过程析出氢气的催化活性显著下降,而唯一的单重态构型1(1)不仅能在与水分子反应吸附氢原子的过程中展现出较好的催化效果,其在解吸过程中更是表现出了远好于其他三重态构型的催化能力。

    2019年01期 v.37 165-172页 [查看摘要][在线阅读][下载 2523K]
  • RbCaCl_3晶体的弹性及热力学性质研究

    胡锡亨;张伟斌;吴青峰;李松;金圆圆;陈善俊;韦建军;

    运用第一性原理赝势平面波密度泛函理论的方法,并结合准谐德拜模型,对钙钛矿结构RbCaCl_3晶体的弹性性质和热力学性质进行研究。以优化的结构为基础,计算了在P=0GPa、T=0K条件下,RbCaCl_3晶体的晶格常数、弹性常数、体弹模量B和剪切模量G,与实验值符合较好;同时计算了RbCaCl_3晶体在零压下的B/G值,根据晶体力学稳定性条件首次推测出RbCaCl_3的相变压强约为10.5GPa。利用准谐德拜模型,计算得到RbCaCl_3在300K的德拜温度,并得到RbCaCl_3的相对体积、热容、热膨胀系数及德拜温度与压强和温度的关系;在高温时,其等体热容Cv接近于Dulong-Petit极限。

    2019年01期 v.37 173-180页 [查看摘要][在线阅读][下载 1245K]
  • 木荷树皮乙醇提取物抗炎镇痛作用研究

    邓志勇;骆海玉;陈超英;邓业成;孙文斌;梁芳铭;

    分别采用醋酸扭体法、二甲苯致小鼠耳廓肿胀法、热板致痛法观察木荷Shima superba树皮乙醇提取物对小鼠的镇痛及抗炎作用。结果表明:1)木荷树皮乙醇提取物能够有效地抑制醋酸引起的小鼠镇痛扭体反应。其200mg·kg-1处理组、400mg·kg-1处理组、800mg·kg-1处理组对小鼠的镇痛率分别为37.9%、52.2%和66.7%,阿司匹林200mg·kg-1处理组的镇痛率为37.4%。2)木荷树皮乙醇提取物能够降低二甲苯引起的小鼠耳廓肿胀。其200 mg·kg-1处理组、400mg·kg-1处理组、800 mg·kg-1处理组对小鼠耳廓肿胀的抑制率分别为35.1%、56.8%和69.3%,阿司匹林200mg·kg-1处理组的抑制率为54.9%。3)木荷树皮乙醇提取物能够提高热板致痛的小鼠痛阈值。其200mg·kg-1处理组、400mg·kg-1处理组、800mg·kg-1处理组药后60min,小鼠痛阈提高率分别为50.1%、63.3%和78.3%,阿司匹林200mg·kg-1处理组的痛阈提高率为63.6%。可见木荷树皮乙醇提取物有明显的抗炎消肿、镇痛的作用。

    2019年01期 v.37 181-186页 [查看摘要][在线阅读][下载 157K]
  • 基于AQI指数的中国城市空气质量时空分布特征

    许燕婷;刘兴诏;王振波;

    基于2014-2016年中国环境保护部公布的城市空气质量指数(air quality index,AQI)日报数据,综合运用空间插值法、空间自相关模型、核密度估计模型等空间数据统计模型探究中国城市空气质量时空分布及动态演进特征。结果显示:(1)2014-2016年中国城市的AQI呈下降的趋势,空气污染城市数量减少,表明城市空气质量有所改善;中国城市AQI季节均值为:冬季>春季>秋季>夏季,夏、秋两季空气质量空间分异格局不显著,春、冬两季的空间分异格局显著,呈北高南低、内陆高沿海低的季节性空间分布格局。(2)中国城市AQI空间分布呈现出持续增强的空间集聚态势,形成以冀鲁豫三省交界处为核心并蔓延至湖北省中北部的中度污染区和以乌鲁木齐和阿图什市为核心的中度污染区,以珠三角城市群为核心的华南地区是稳定的空气质量优良区。(3)从核密度估计图可以发现中国城市空气质量空间分布格局表现为6个显著核心密度区和3个次级核心密度区,2014-2016年内该基本格局在局部区域发生较明显变化。本文通过不同的时间尺度全面分析了中国城市空气质量的空间分布特征,旨在为中国各个城市制定相关的空气质量防治政策提供科学依据。

    2019年01期 v.37 187-196页 [查看摘要][在线阅读][下载 9803K]
  • 2000年和2015年乌江中上游景观稳定性变化研究

    韩会庆;蔡广鹏;尹昌应;马庚;张英佳;陆艺;

    为评价我国西南山区景观稳定状况,基于2000年和2015年Landsat遥感影像,以乌江中上游为例,从基质稳定性、斑块特征稳定性和斑块密度稳定性3个方面对流域景观稳定性进行分析。结果表明:2000—2015年,景观基质稳定性呈下降趋势。景观斑块特征稳定性呈裸地>灌木林>草地>水域>森林>耕地>建设用地。景观斑块密度稳定性呈裸地>灌木林>草地>森林>水域>建设用地>耕地。流域景观基质稳定性、斑块特征稳定性和斑块密度稳定性指数空间异质性突出。生态治理工程及快速经济发展是影响乌江中上游景观稳定性的主要因素。

    2019年01期 v.37 197-204页 [查看摘要][在线阅读][下载 5349K]
  • 99例异常染色体核型分析

    穆汇;欧明林;汤冬娥;张若菡;何慧燕;梁灼健;邹贵勉;戴勇;

    为了探讨外周血染色体和羊水染色体核型异常与疾病的关系并进行相关临床分析,收集2016年6—12月到中国人民解放军第181医院就诊的疑似有染色体病的患者1 868例,以及在深圳市人民医院就诊并自愿抽取羊水进行产前诊断的孕妇541名,通过常规方法制备染色体标本,进行染色体G显带核型分析。结果:共发现特别异常外周血染色体核型15例;胎儿染色体核型异常84例,阳性率为15.52%。这99例异常染色体核型表明染色体检查可以及时发现相关的染色体病,可以更加明确其遗传学诊断,避免盲目治疗,有效减少染色体异常患儿的出生。

    2019年01期 v.37 205-210页 [查看摘要][在线阅读][下载 2010K]
  • 吉富罗非鱼HSP70基因的多态性及其与耐寒性状的相关性研究

    宾石玉;钟丹丹;杜雪松;张永德;林勇;黄姻;文露婷;

    利用PCR-SSCP技术对吉富罗非鱼HSP70基因多态性进行检测,并采用最小二乘法分析多态性与罗非鱼Oreochromis niloticus耐寒性状的相关性。结果发现,依据HSP70基因序列设计的引物HP70-1、HP70-4、HP70-6不同耐寒能力样本中的电泳图具有带型多态性,且该基因多态性与其耐寒性状显著相关。据此推断HSP70基因是潜在的罗非鱼耐寒相关基因。

    2019年01期 v.37 211-217页 [查看摘要][在线阅读][下载 1324K]
  • 广西猫儿山野化放归白颈长尾雉的食性研究

    张刚;庾太林;陈道剑;马昱君;吴冉昕;

    2016年11月—2017年4月,在广西猫儿山国家级自然保护区对一批白颈长尾雉Syrmaticusellioti进行野化和放归,采用人工投喂和无线电跟踪观察等方法研究其取食选择,包括食物的种类、喜欢程度等。研究期间,共记录到白颈长尾雉选择的植物性食物有18科28种,取食部位有果实、嫩芽、叶子等;动物性食物有鳞翅目Lepidoptera、直翅目Orthoptera、膜翅目Hymenoptera、鞘翅目Coleoptera 4个目的昆虫。

    2019年01期 v.37 218-222页 [查看摘要][在线阅读][下载 130K]
  • 《广西师范大学学报》(自然科学版)稿约

    <正>《广西师范大学学报》(自然科学版)是由广西师范大学主管、主办的综合性学术理论刊物,创刊于1957年,办刊宗旨为:坚持四项基本原则,在马克思列宁主义指导下,结合社会主义建设实际,开展自然科学学术理论研究,培养学术人才。先后被评为广西高校十佳学报、广西十佳自然科学期刊、中国高校民族类优秀科技期刊、全国高校优秀科技期刊一等奖等;2004年、2008年、2011年和2014年连续四届被认定

    2019年01期 v.37 223页 [查看摘要][在线阅读][下载 47K]
  • 《中文核心期刊要目总览》入编通知

    <正>《广西师范大学学报.自然科学版》主编:我们谨此郑重通知:依据文献计量学的原理和方法,经研究人员对相关文献的检索、统计和分析,以及学科专家评审,贵刊《广西师范大学学报.自然科学版》入编《中文核心期刊要目总览》2017年版(即第8版)之"综合性科学技术"类的核心期刊。该书由北京大学出版社出版。书中按《中国图书馆分类法》的学科体系,列出了78个学科的核心期刊表,并逐一对核心期刊进行

    2019年01期 v.37 224页 [查看摘要][在线阅读][下载 1071K]
  • 下载本期数据