Please wait a minute...

过刊浏览

    2022年 第50卷 第12期    刊出日期:2022-12-25
    2022, 50(12):  0-0. 
    摘要 ( 33 )   PDF (420KB) ( 204 )  
    相关文章 | 多维度评价
    计算机科学与技术
    邢晓芬, 李敏盛, 徐向民
    2022, 50(12):  1-12.  doi:10.12141/j.issn.1000-565X.220165
    摘要 ( 1074 )   HTML ( 59)   PDF (6379KB) ( 83 )  
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    常见的图像情感转换方法基于迁移图像颜色可以迁移图像情感的假设,但由于图像内容的影响,直接迁移图像颜色并不能完全迁移图像情感,而且需要先获得合适的参考图像,再进行图像颜色迁移,但在实际应用中,会面临情感上与目标图像情感相近、内容上与源图像相近的参考图像获取困难、颜色迁移时需考虑局部对象语义一致性等问题。为此,文中提出了一种基于自适应亮度调节的图像情感转换方法。该方法根据心理学中图像亮度与图像情感(又称愉悦度,简称V值)具有显著相关性,通过深度神经网络ISTNet自适应地调节亮度,将图像转换到目标图像情感。首先,从现有的图像情感数据集中获取一幅图像及其对应的真实V值,通过改变图像亮度,可获得一系列亮度不同的图像;然后,通过预训练图像V值回归器预测这些内容相同而亮度不同的图像对应的伪V值;最后,利用这些图像和伪V值训练ISTNet,以学习图像亮度调节和情感变化之间的内在联系。在实际应用时,无需任何参考图像,直接将待转换图像和目标V值输入神经网络ISTNet,就可以得到对应情感标签的输出图像。实验结果表明,该方法的图像情感转换性能优于现有的基于颜色的图像情感迁移方法。

    陆以勤, 潘周双, 张洋, 等
    2022, 50(12):  13-19.  doi:10.12141/j.issn.1000-565X.220384
    摘要 ( 1660 )   HTML ( 20)   PDF (1179KB) ( 362 )  
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    知识图谱为许多智能信息服务应用提供了底层支持,包括智能搜索、公共安全、金融、医疗等领域,但现有的知识图谱通常是不完整的,知识图谱补全已经成为亟需解决的问题。现有的知识图谱补全方法忽略了邻居节点以及关系所富含的重要信息,往往只是简单地将邻居节点和关系拼接起来,忽略了不同关系和邻居节点对于节点有着不同的重要性。为此,文中提出了一种基于交互式连接图注意力网络的知识图谱补全方法(ICGAT)。该方法首先通过寻找两跳邻居节点,挖掘出潜在可能的关系,扩充每个节点的三元组;然后将每个三元组中的关系与节点的特征融合,并且采用节点与邻居节点交互式连接的方法,用4个空间向量来表示交互式连接的关系;最后将交互式连接的向量输入图注意力网络,得到关系和邻居节点对该节点的权重,以此说明其重要性。为了有效地表示一对多、多对多等复杂关系的三元组,该方法使用RotatE模型作为预训练模型。在链接预测任务中的实验结果表明,ICGAT方法在WN18RR和FB15k-237数据集中的平均排名(MR)和排名前10命中率(HR@10)均有一定的提升,说明ICGAT能够提高链接预测任务的准确性。

    杜启亮, 向照夷, 田联房, 等
    2022, 50(12):  20-29.  doi:10.12141/j.issn.1000-565X.220055
    摘要 ( 1300 )   HTML ( 14)   PDF (2386KB) ( 121 )  
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    人体动作识别因在公共安全方面具有重要的作用而在计算机视觉领域备受关注。然而,现有的图卷积网络在融合多尺度节点的邻域特征时,通常采用各阶邻接矩阵直接相加的方法,各项重要性一致,难以聚焦于重要特征,不利于最优节点关系的建立,同时采用对不同模型的预测结果求平均的双流融合方法,忽略了潜在数据的分布差异,融合效果欠佳。为此,文中提出了一种双流自适应注意力图卷积网络,用于对人体动作进行识别。首先,设计了能自适应平衡权重的多阶邻接矩阵,使模型聚焦于更加重要的邻域;然后,设计了多尺度的时空自注意力模块及通道注意力模块,以增强模型的特征提取能力;最后,提出了一种双流融合网络,利用双流预测结果的数据分布来决定融合系数,提高融合效果。该算法在NTU RGB+D的跨主体和跨视角两个子数据集上的识别准确率分别达92.3%和97.5%,在Kinetics-Skeleton数据集上的识别准确率达39.8%,均高于已有算法,表明了文中算法对于人体动作识别的优越性。

    余陆斌, 田联房, 杜启亮
    2022, 50(12):  30-40.  doi:10.12141/j.issn.1000-565X.210541
    摘要 ( 1864 )   HTML ( 21)   PDF (4180KB) ( 69 )  
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    目标跟踪在计算机视觉任务中有重要的意义。近年来随着深度学习的发展,基于孪生网络的目标跟踪算法因其优异的性能而被广泛应用。然而,现有基于孪生网络的跟踪算法在目标发生较大形变、低分辨率、复杂背景等情况下的跟踪性能通常会显著下降。为此,文中提出了一种基于多分支注意力孪生网络的目标跟踪算法。该算法首先构建了超分辨率模块和数据增强模块,分别对目标模板进行超分辨率和数据增强,提升目标模板的特征表征能力;然后利用3个主干网络分别提取原始目标模板、超分辨率目标模板和数据增强目标模板的特征,并进行特征融合,同时在主干网络中应用了通道注意力模块和空间注意力模块,以提升特征提取能力;最后,将融合后的特征图与待搜索区域的特征图输入区域生成网络模块,得到目标跟踪信息。实验结果表明,该算法在OTB100数据集上的精确率为0.919、成功率为0.707,在VOT2018数据集上的准确率为0.642、鲁棒性为0.149,在实际场景中的运行速度每秒至少20次,说明该算法具有优异的跟踪性能,并且在各种复杂场景下都具有良好的鲁棒性。

    易清明, 吕人毅, 石敏, 等
    2022, 50(12):  41-48.  doi:10.12141/j.issn.1000-565X.220095
    摘要 ( 3080 )   HTML ( 10)   PDF (2447KB) ( 210 )  
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    深度神经网络存在目标检测速度慢、参数量大的问题,不适用于算力有限但速度要求较高的移动应用场景。为了提高目标检测的推理速度,有效权衡目标检测任务的精度与速度,文中提出了一种融合多尺度空洞卷积与反卷积的轻量化目标检测网络MDDNet。首先,基于高效的单阶段多目标检测策略设计了轻量的目标检测基础网络,并引入深度可分离卷积,以进一步减少基础网络的参数量,加快图像特征提取的速度;然后在主干网络中添加两条基于多尺度空洞卷积的特征扩展旁路,分别连接在基础网络的最末端和次末端残差层的输出端,将两条旁路的特征输出到预测层进行特征融合,以增强较低层特征图的纹理特征;并且进一步引入了多尺度反卷积模块,连接于深层特征网络层,以增大特征图尺寸,再融合具有不同尺度的上一层的浅层特征图,以获得更多的特征语义信息和细节信息,提高检测精度;最后在预测层基于K均值算法优化先验框参数,使其与目标真实框更匹配,提高目标识别的准确率。实验结果表明:MDDNet的参数量约为7.21×106,平均检测精度在KITTI、Pascal VOC数据集上分别为58.7%、76.0%,推理速度在两个数据集上分别达到55和52 f/s。因此,MDDNet在参数量、检测速度和检测精度上达到了较佳的平衡,可适用于移动端的实时目标检测。

    余映, 何鹏浩, 徐超越
    2022, 50(12):  49-59.  doi:10.12141/j.issn.1000-565X.220025
    摘要 ( 1001 )   HTML ( 7)   PDF (7978KB) ( 57 )  
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    图像修复在计算机视觉任务中具有重大的意义和价值。近年来,基于深度学习的图像修复模型被广泛应用于该领域中。但是现有的深度学习图像修复模型存在对破损图像中有效信息的利用不足和受破损图像中掩码信息干扰的问题,从而导致修复出的图像的部分结构缺失和部分细节模糊。为此,文中提出了基于残差注意力融合和门控信息蒸馏的图像修复模型。首先,该图像修复模型由生成器和鉴别器两部分组成,生成器的主干结构采用U-Net网络,由编码器和解码器组成;鉴别器采用马尔可夫鉴别器,由6个卷积层组成。然后,在编码器和解码器中分别构建残差注意力融合结构,以增强破损图像中有效信息的利用和减少掩码信息的干扰。最后,在编码器和解码器的跳跃连接中嵌入门控信息蒸馏模块,进一步提取待修复图像中的有效低级特征。在公开人脸和街景数据集上的实验结果表明:文中模型在语义结构和纹理细节方面具有更好的修复效果;文中模型的结构相似性、峰值信噪比、平均绝对值误差、最小平方误差和弗雷歇距离指标均优于5种对比模型,说明文中模型的修复质量优于对比模型。

    刘小兰, 石宗宇, 叶泽慧, 等
    2022, 50(12):  60-70.  doi:10.12141/j.issn.1000-565X.220069
    摘要 ( 1035 )   HTML ( 14)   PDF (2961KB) ( 59 )  
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    经典的多视图聚类任务针对的是完整数据,然而实际任务中受限于信息的获取渠道,某些视图往往含有缺失数据,由此引出了缺失多视图聚类问题。针对此问题,现有的聚类模型大多基于非负矩阵分解或距离构造聚类图,存在着联合优化使解的性能得不到保障以及无法对全局结构进行充分刻画的不足。为了提升聚类图的性能,基于低秩子空间聚类和锚点图,文中提出了一种低秩缺失多视图子空间聚类算法ALIMSC。该算法先通过基于锚点图的缺失多视图聚类(APMC)算法得到数据的基准相似矩阵,将其嵌入低秩子空间聚类模型,通过升维对齐和加权融合的方法得到相似矩阵,再通过让相似矩阵与基准相似矩阵尽可能的一致来求得最终的聚类图。ALIMSC算法通过对每个视图的相似矩阵施加秩最小化约束来刻画高维数据的低维子空间分布,在原有锚点图的基础上进一步强调了数据的子空间算法结构,即聚类图中所体现的块对角性。在多个公开数据集上的实验结果表明,本文算法的聚类性能优于所对比的缺失多视图聚类算法。

    蔡晓东, 曾志杨
    2022, 50(12):  71-79.  doi:10.12141/j.issn.1000-565X.220180
    摘要 ( 972 )   HTML ( 7)   PDF (1245KB) ( 65 )  
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    以往的序列推荐方法通常从近期交易记录中捕获用户的消费偏好,忽略了全局交易信息和好友偏好对用户交易行为的影响,导致模型的推荐结果不够准确。针对以上问题,文中提出了一种自适应融合全局协同特征的社交推荐模型AFGSRec。首先,用异质图神经网络建模社交网络中的用户、历史交易信息,以捕获全局协同特征和好友之间的社交影响;接着,设计了一种基于选择机制的门图神经网络,以有效过滤与当前序列无关的节点转换信息,更准确地捕获用户当前偏好;然后,提出了一种自适应的特征融合方法,以动态捕获全局协同特征对用户偏好的影响,提高系统的推荐准确率;最后,将周期动态学习率用于模型训练,以更好地处理鞍点,提升模型的收敛速度。实验结果表明:AFGSRec具有较好的鲁棒性,命中率(HR)和平均倒数排名(MRR)都优于当前领先模型SERec,在Gowalla数据集上,HR@10、HR@20分别提升了1.91%和1.15%,MRR@10、MRR@20分别提升了5.05%和4.83%;在Delicious数据集上,HR@10、HR@20分别提升了2.45%和1.19%,MRR@10、MRR@20分别提升了4.84%和4.32%。

    王洁, 夏晓明
    2022, 50(12):  80-88.  doi:10.12141/j.issn.1000-565X.220013
    摘要 ( 2899 )   HTML ( 11)   PDF (1576KB) ( 98 )  
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    命名实体识别是自然语言处理的一项基本任务,对信息提取、机器翻译等具有重要的意义和价值。目前命名实体识别通常使用序列标注方法对文本中单个句子的实体进行抽取,忽略了句子间的语义信息。基于机器阅读理解的命名实体识别方法借助问题编码了实体类别的重要先验信息,更加容易区分出相似的分类标签,降低了模型学习难度,但仍然只在句子级别建模,忽略了句子间的语义信息,容易造成不同句子中实体标注不一致的问题。为此,文中将句子级别的命名实体识别扩展到文本级别的命名实体识别,提出了一种基于机器阅读理解的BiLSTM-BiDAF命名实体识别模型。首先,为了充分挖掘文本的上下文特征,使用NEZHA获取全文语境信息,并进一步通过BiLSTM提取局部特征,以加强模型对局部依赖信息的捕获能力;然后,引入双向注意力机制学习文本与实体类别之间的语义关联;最后,设计基于门控机制的边界检测器加强实体边界的相关关系,预测出实体在文本中的位置,同时通过建立答案数量检测器,将无答案问题识别出来。在CCKS2020中文电子病历数据集和CMeEE数据集上的实验结果表明,文中构建的模型能有效地识别文本中的命名实体,F1值可分别达到84.76%和57.35%。

    电子、通信与自动控制
    陈芳炯, 刘明星, 付振华, 等
    2022, 50(12):  89-100.  doi:10.12141/j.issn.1000-565X.220040
    摘要 ( 1039 )   HTML ( 2)   PDF (1980KB) ( 84 )  
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    为应对复杂的水声信道环境,提高信道均衡算法的收敛速度和误码率性能,文中提出了一种零值吸引稀疏控制成比例最小误码率判决反馈均衡算法。该算法在稀疏控制成比例最小误码率判决反馈均衡算法的基础上,通过在目标函数中加入近似l0范数的稀疏约束,迫使均衡算法在迭代过程中将幅值小的均衡器抽头向零值吸引,以加快均衡算法的初始收敛速度;同时在信道均衡过程中引入锁相环技术,以消除抖动相位噪声带来的影响。传统的锁相环技术都是基于最小均方误差准则的,但现有文献和相关实验仿真已经证明,当系统的均方误差最小时,误码率不一定最小。针对此问题,文中提出了一种基于最小误码率准则的锁相环相位追踪算法,并将其嵌入稀疏均衡算法中。在Matlab平台上,分别在实际采集的静态水声信道和实际时变水声信道条件下进行了实验,结果表明:加入近似l0范数约束的稀疏控制成比例最小误码率判决反馈均衡算法,在没有时变相位噪声影响下的收敛速度更快;在有时变相位噪声影响的信道条件下,基于最小误码率准则的锁相环相位追踪算法相较于基于最小均方误差准则的锁相环相位追踪算法,收敛速度更快,误码率性能更优。

    郑娟毅, 慕金玉, 邢丽荣, 等
    2022, 50(12):  101-108.  doi:10.12141/j.issn.1000-565X.220017
    摘要 ( 2000 )   HTML ( 25)   PDF (1825KB) ( 533 )  
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    在带有透镜天线阵列的毫米波大规模多输入多输出系统中,由于射频链路远少于天线数量,因而需要从低维的有效观测信号中通过信道估计恢复出高维信道。当前的信道估计方法基本上利用波束空间信道的稀疏性,将信道估计转化为压缩感知问题再采用不同方法进行估计。针对近似消息传递(AMP)算法在信道估计时需要信道先验信息的局限性,文中提出了一种改进的信道估计算法。首先基于AMP算法推导出新的噪声项并使用卷积神经网络进行拟合,然后将迭代去噪过程展开成深度网络来求解观测信号到信道的线性逆变换,最后将初步估计到的信道通过去残留噪声网络进一步优化。此外,文中引入了可控制参数来增加信道估计过程的灵活性,并通过感知矩阵与其他网络参数的联合训练来提高信道的估计精度。文中从信道的估计精度和系统传输质量两方面对所提算法进行验证,在Saleh-Valenzuela信道模型上进行理论公式推导和系统仿真分析。仿真结果表明,与传统算法相比,文中提出的算法具有较少的模型参数和计算量,并且提高了信道估计精度和通信系统的传输质量。

    陈鹏, 陈洋, 王威
    2022, 50(12):  109-123.  doi:10.12141/j.issn.1000-565X.220277
    摘要 ( 1286 )   HTML ( 7)   PDF (2928KB) ( 325 )  
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    近年来“低小慢”无人机的过快增长,肆意飞行严重威胁了城市安防和公众安全。如何在复杂低空环境下有效地定位“低小慢”无人机,成为亟待解决的社会问题。由于雷达、光电探测等手段存在盲区、辐射强度弱等问题,导致近距离定位效果不理想。声学定位因其传感器成本低,阵列布放形式灵活,近距离定位误差较小,有效地补充了雷达、光电等定位方法的缺陷。文中对无人机声学定位方法进行了综述,分析了无人机噪声的频谱,发现这些噪声信号具有很强的线谱结构,这些线谱具有丰富的谐频成分和很高的信噪比,且抗干扰能力较强。首先结合旋翼噪声的声学特性得出了从时域角度和频域角度定位无人机的可行性;接着介绍了声学定位方法的原理,并给出了算法仿真结果,比较了时域和频域定位方法的均方根误差;然后统计了近年来国内外高校基于声学定位的低空无人机的实现方法,发现基于到达时间差(TDOA)的平面阵列使用最广,定位效果较好;最后对未来低空无人机声学定位进行了展望。

    孟凡易, 刘芷蘅, 王毓, 等
    2022, 50(12):  124-131.  doi:10.12141/j.issn.1000-565X.220143
    摘要 ( 1215 )   HTML ( 6)   PDF (3309KB) ( 117 )  
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    对称型双向放大器的接收、发射模式采用相同的放大核心,能够降低匹配网络结构的复杂度,减小芯片面积。为进一步降低对称型双向放大器芯片的面积,文中提出了一种融合不同工作状态下晶体管寄生参数的双向匹配技术,探明了在不同偏置状态下硅基晶体管的节点阻抗变化与匹配电路阻抗的映射关系;基于德国IHP微电子研究所0.13 μm SiGe BiCMOS工艺,采用该匹配技术,设计了一款207~215 GHz高增益、无开关式对称型双向放大器,该放大器通过对电路偏置的切换来实现消除通信系统中单刀双掷开关的目的。文中通过对芯片版图的镜像对称性进行优化来保证该双向放大器正向和反向性能的一致。全波电磁仿真和电路仿真结果表明:在工作频段内该双向放大器每个通道的最大增益为28.6 dB,最小噪声系数为16 dB,双向匹配网络的输入、输出反射系数S11S22的最小值分别为-13.6 dB、-15.5 dB,芯片功耗为63 mW,核心面积仅为0.17 mm2,说明该双向匹配网络在节省芯片面积的同时,能够实现优良的输入输出和噪声匹配效果;文中设计的无开关式硅基双向放大器可实现200 GHz以上的工作频率,具有高增益和面积紧凑的特点。该双向放大器极大地缩小了芯片面积,降低了射频前端成本,可应用于太赫兹微系统。

    杨晋生, 陈洪鹏, 关欣, 等
    2022, 50(12):  132-141.  doi:10.12141/j.issn.1000-565X.220042
    摘要 ( 955 )   HTML ( 4)   PDF (2187KB) ( 100 )  
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    手动分割核磁共振成像(MRI)图像中的脑肿瘤区域费时、费力,容易受个人主观性的影响,能够可靠、高效的半自动或自动分割脑肿瘤,对于医学辅助诊断尤为重要。近年来,基于卷积神经网络的脑肿瘤图像自动分割方法虽然取得了长足进步,但现有方法仍未能有效地融合肿瘤图像大尺度轮廓和小尺度纹理细节等方面特征,忽略了训练时丰富的全局上下文信息。针对这些问题,文中提出了一种多尺度轻量级脑肿瘤图像分割网络MSL-Net。首先,利用改进的分层解耦卷积替换U-Net网络中的基础卷积,在高效探索多尺度多视图空间信息的同时扩大了感受野;然后,在跳跃连接处引入双向加权空洞特征金字塔结构以融合多尺度特征,并使用结合了广义Dice损失函数和Focal损失函数的混合损失函数,以提升肿瘤和非肿瘤区像素数量不平衡情况下的分割精度并加快收敛速度。在BraTS 2019数据集上的实验结果表明:文中所提出的MSL-Net网络在整体肿瘤区、核心肿瘤区和增强肿瘤区的Dice相似系数分别为0.900 3、0.830 6和0.777 0,参数量和计算量(每秒浮点运算次数)分别为3.9×105和3.16×1010;与目前先进的方法相比,文中方法在实现轻量化的同时获得高的分割精度。

    严洪立, 黄林南, 高跃明, 等
    2022, 50(12):  142-150.  doi:10.12141/j.issn.1000-565X.210752
    摘要 ( 1086 )   HTML ( 5)   PDF (2847KB) ( 108 )  
    数据和表 | 参考文献 | 相关文章 | 多维度评价

    表面肌阻抗图(sEIM)是肌肉失衡与肌肉疾病状态评估中的重要手段。表面电极获取的皮下多层组织阻抗混合信号包含众多冗余成分。为了提升sEIM检测对目标肌肉状态变化的敏感性,文中将sEIM获取的混合信号作为盲信号,肌肉层阻抗值作为源信号,提出了一种基于阻抗等效分析和盲源分离的肌肉层阻抗分离方法。首先,建立肢体多层圆柱体有限元模型,采用灵敏度方法计算各组织层的阻抗贡献,用于排除冗余微弱信号,并将其等效为以肌肉为目标组织的盲源分离问题;然后,通过数值仿真和在体实验,比较了独立成分分析法、主成分分析法和等变化自适应独立分离法(EASI)的分离效果,获得最优方案并验证方法的可行性。结果显示,采用EASI分离肌肉层阻抗的方法,相关系数大于0.98,抗噪性约为0.8,串音误差收敛于0.876,在体实验中分离的肌肉层阻抗值符合人体阻抗特性规律,表明采用EASI的肌肉层阻抗分离方法能够较好地分离sEIM中肌肉层阻抗值,可用于提升检测目标的肌肉状态变化敏感性。

通知公告
精彩推荐
阅读排行
下载排行
引用排行