图片丢失啦 2024年计算机科学与技术

    默认 最新文章 浏览次数
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 基于格拉姆角差场和生成对抗网络的小样本滚动轴承故障诊断方法
    强睿儒, 赵小强
    华南理工大学学报(自然科学版)    2024, 52 (10): 64-75.   DOI: 10.12141/j.issn.1000-565X.240021
    摘要2038)   HTML14)    PDF(pc) (4151KB)(136)    收藏

    针对基于深度学习的滚动轴承故障诊断算法需要从大量标注数据中学习,且面对样本数量受限时诊断效果不佳的问题,文中提出了一种基于格拉姆角差场(GADF)和生成对抗网络(GAN)的小样本滚动轴承故障诊断方法。首先,提出了基于GADF变换的数据增强方式,将少数1维振动信号通过GADF变换转换为2维GADF图像,并通过裁剪得到GADF子图,从而得到大量的图像样本;然后,将条件生成对抗网络(CGAN)与带有梯度惩罚的Wasserstein GAN(WGAN-GP)相结合,构建一种新的生成对抗网络,该网络通过条件辅助信息与梯度惩罚增强模型训练稳定性,并设计动态坐标注意力机制以增强模型的空间感知能力,从而生成高质量样本;最后,使用生成的样本对分类器进行训练,并在验证集上得到诊断结果。文中分别使用东南大学数据集和美国凯斯西储大学(CWRU)数据集进行了两组小样本环境下的轴承故障诊断实验。结果表明,与传统生成对抗网络以及先进的小样本故障诊断方法相比,文中所提方法的准确率和精确率等5项故障诊断指标均获得最好的结果,可以准确诊断出小样本条件下的轴承故障类型。

    图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
    2. 面向部分工序无序加工的柔性作业车间批量调度方法
    柳宁, 华天标, 王高, 等
    华南理工大学学报(自然科学版)    2024, 52 (10): 51-63.   DOI: 10.12141/j.issn.1000-565X.230722
    摘要179)   HTML14)    PDF(pc) (5299KB)(117)    收藏

    实际的车间调度问题往往具有更高的复杂度,调度算法需要考虑更多的约束条件,因此增加了问题的求解难度。为解决柔性作业车间批量调度场景中不同批次、不同工序之间可以无序加工的难题,进而突破现有车间机器使用率低、同类型机器负载不均衡的难点,文中构建了一种面向部分工序无序加工的柔性作业车间等量分批调度模型。首先,基于广泛使用的快速非支配排序遗传算法(NSGA-Ⅱ),提出了一种融合批次、批量和工序排序信息的两段编码结构,采用优先级规则方法获得初始种群,并以最小化完工时间、机器负载均衡率、机器总负荷为优化目标,采用贪心算法求解模型最优值,进而动态构建不同批次的加工路径;然后,对优化目标函数进行排序,再逐步加入非支配排序过程,以解决多个优化目标函数之间难以同时优化的问题,提高求解效率;最后,以某印刷包装企业的木制品加工车间为例,面向现场作业信息,采用仿真手段实现调度过程。结果表明,与优先级调度规则相比,文中所提方法的完工时间平均缩短了6.6%、机器负载均衡方差平均减小了10.7%,文中所提方法的机器负载均衡方差比遗传算法平均减小了53.3%,从而验证了文中方法的可行性,且该方法可以满足印刷包装企业柔性作业车间的高性能调度需求。

    图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
    3. 面向自动驾驶的多任务辅助驾驶策略学习方法
    罗玉涛, 薛志成
    华南理工大学学报(自然科学版)    2024, 52 (10): 31-40.   DOI: 10.12141/j.issn.1000-565X.230503
    摘要1916)   HTML15)    PDF(pc) (3027KB)(213)    收藏

    随着自动驾驶技术的发展,深度强化学习成为实现高效驾驶策略学习的重要手段。然而,实施自动驾驶面临着复杂多变的交通场景带来的挑战,并且现有的深度强化学习方法存在场景适应能力单一、收敛速度较慢的问题。针对此类问题,为提高自动驾驶车辆的场景适应能力和策略学习效率,文中提出了一种多任务辅助的驾驶策略学习方法。该方法首先基于深度残差网络构建了编码器-多任务解码器模块,将高维驾驶场景压缩为低维表征,并采用语义分割、深度估计和速度预测的多任务辅助学习,以提高低维表征的场景信息丰富程度;然后,以该低维表征作为状态输入,构建基于强化学习的决策网络,并设计多约束奖励函数来引导驾驶策略的学习;最后,在CARLA中进行仿真实验。结果表明:相较于DDPG、TD3等经典方法,文中方法通过多任务的辅助改善了训练进程,学习到更优的驾驶策略;在环岛、路口等多个典型城市驾驶场景中实现了更高的任务成功率和驾驶得分,具备优秀的决策能力和场景适应性。

    图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
    4. 基于语义-视觉一致性约束的零样本图像语义分割网络
    陈琼, 冯媛, 李志群, 等
    华南理工大学学报(自然科学版)    2024, 52 (10): 41-50.   DOI: 10.12141/j.issn.1000-565X.230673
    摘要170)   HTML12)    PDF(pc) (2148KB)(124)    收藏

    零样本图像语义分割是零样本学习在视觉领域的重要任务之一,旨在分割训练中未见的新类别。目前基于像素级视觉特征生成的方法合成的视觉特征分布和真实的视觉特征分布存在不一致性的问题,合成的视觉特征难以准确反映类语义信息,导致合成的视觉特征缺乏鉴别性;现有的一些视觉特征生成方法为了得到语义特征所表达的区分性信息,需要消耗巨大的计算资源。为此,文中提出了一种基于语义-视觉一致性约束的零样本图像语义分割网络(SVCCNet)。该网络通过语义-视觉一致性约束模块对语义特征与视觉特征进行相互转换,以提高两者的关联度,减小真实视觉特征与合成视觉特征空间结构的差异性,从而缓解合成视觉特征与真实视觉特征分布不一致的问题。语义-视觉一致性约束模块通过两个相互约束的重建映射,实现了视觉特征与类别语义的对应关系,同时保持了较低的模型复杂度。在PASCAL-VOC及PASCAL-Context数据集上的实验结果表明,SVCCNet的像素准确率、平均准确率、平均交并比、调和交并比均优于比较的主流方法。

    图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
    5. 基于先验知识和网格监督的手部姿态估计
    孙迪钢, 张平
    华南理工大学学报(自然科学版)    2024, 52 (6): 138-147.   DOI: 10.12141/j.issn.1000-565X.230420
    摘要152)   HTML5)    PDF(pc) (2590KB)(26)    收藏

    手部自遮挡和深度信息缺失使得由单目RGB图像进行三维手部姿态估计存在关节相对深度估计不够准确、生成的姿态违背手部生物力学约束等问题。为解决此问题,文中结合手部结构中蕴含的先验知识以及手部网格信息,提出一种基于先验知识和网格监督的深度神经网络。手部骨架的铰链式结构意味着关节三维位置在二维图像平面和深度方向的投影之间存在着特定关系,但个体之间的手部结构差异导致难以对其进行直观的形式化描述,为此文中提出通过学习来对其进行拟合。同一手指的关节位置和骨骼长度、同一手指的不同分段以及不同手指的弯曲方向之间也存在特定关系,文中将其设计为损失函数,用于监督网络训练。所提出的神经网络在估计手部姿态的同时并行生成手部网格,通过网格标注监督网络训练,优化姿态估计,且不增加网络复杂度。使用混合数据集对神经网络进行了训练,以进一步提高其泛化能力。实验结果表明,所提方法在多个数据集的内部交叉验证精度、跨数据集验证精度、模型的时间和空间复杂度等方面都优于其他方法,手部结构先验知识和网格监督在提升姿态估计精度的同时保持了神经网络结构的紧凑性。

    图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
    6. 基于采样的点云几何编码框架
    刘昊, 元辉, 陈晨, 等
    华南理工大学学报(自然科学版)    2024, 52 (6): 148-156.   DOI: 10.12141/j.issn.1000-565X.230188
    摘要159)   HTML5)    PDF(pc) (3565KB)(33)    收藏

    随着科学技术的快速发展,三维点云采集设备的精度不断提升,海量三维点云数据的获取成为可能。然而,三维点云数据点分布不规则、数量巨大等特性给存储和传输带来了巨大的挑战,点云编码势在必行。针对三维点云几何信息,文中从数据采样的角度出发,将三维点云编码问题转换为三维点云采样-重建问题,并提出基于采样的三维点云几何编码框架。该框架首先在编码端使用指定采样率的三维点云下采样方法,将原始三维点云下采样至指定点数的稀疏三维点云,然后采用任意现有的编码方法对稀疏三维点云进行编码(待编码点数大幅减少,可有效降低编码码率),最后使用三维点云上采样方法将解码端获得的稀疏三维点云插值重建成与原始输入点云外形近似的高质量稠密三维点云。实验结果表明,与MPEG提出的最新G-PCC三维点云编码标准相比,在相同码率下,文中提出的三维点云几何编码框架可以使解码端重建三维点云的客观质量平均提升5.49 dB,同时呈现出更好的主观视觉效果。

    图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
    7. 基于多尺度时空特征和篡改概率改善换脸检测的跨库性能
    胡永健, 卓思超, 刘琲贝, 等
    华南理工大学学报(自然科学版)    2024, 52 (6): 110-119.   DOI: 10.12141/j.issn.1000-565X.230105
    摘要126)   HTML4)    PDF(pc) (2582KB)(114)    收藏

    目前大多DeepFake换脸检测算法过于依赖局部特征,尽管库内检测性能尚佳,但容易出现过拟合,导致跨库检测性能不理想,即泛化性能不够好。有鉴于此,文中提出一种基于多尺度时空特征和篡改概率的换脸视频检测算法,目的是利用假脸视频中广泛存在的帧间时域不连续性缺陷来解决现有检测算法在跨库、跨伪造方式和视频压缩时性能明显下降的问题,改善泛化检测能力。该算法包括3个模块:为检测假脸视频在时域上留下的不连续痕迹,设计了一个多尺度时空特征提取模块;为自适应计算多尺度时空特征之间的时空域关联性,设计了一个三维双注意力机制模块;为预测随机选取的像素点的篡改概率和构造监督掩膜,设计了一个辅助监督模块。将所提出的算法在FF++、DFD、DFDC、CDF等公开大型标准数据库中进行实验,并与基线算法和近期发布的同类算法进行对比。结果显示:文中算法在保持库内平均检测性能优良的同时,跨库检测和抗视频压缩时的综合性能最好,跨伪造方法检测时的综合性能中等偏上。实验结果验证了文中算法的有效性。

    图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
    8. 基于差分隐私的路网环境skyline查询
    李松, 王赫, 张丽平
    华南理工大学学报(自然科学版)    2024, 52 (6): 120-127.   DOI: 10.12141/j.issn.1000-565X.220728
    摘要237)   HTML5)    PDF(pc) (1627KB)(21)    收藏

    路网中的skyline查询在智慧交通、兴趣点发现和位置服务等领域具有重要的应用价值,但存在查询效率较低、未考虑查询结果的隐私性等问题。有鉴于此,文中提出了一种基于差分隐私的路网环境下skyline查询方法。首先,针对路网环境下的初始数据集数据量大和数据复杂的特点,对数据集进行预处理,利用基于距离属性划分的skyline层和路网Voronoi图的性质提出了3个剪枝规则,基于剪枝规则给出了路网环境下的数据集剪枝算法,从而有效地过滤掉大量冗余数据;其次,针对过滤后的数据集,利用网格索引的存储方式来节省存储空间,并设计了基于网格索引的skyline扩展树,基于扩展树和相应的剪枝规则提出了查询全局候选skyline点集的算法;最后,针对查询结果集,利用差分隐私预算分配模型来分配隐私预算,并基于信息散度进行结果集发布,有效提高了数据信息的隐私性。实验结果表明:所提出的查询方法的准确率在99%以上;其在数据集规模较大情况下的查询效率相较于传统skyline查询方法提升10%以上;在总差分隐私预算为0.01、0.10、0.50和1.00时,所提出的隐私预算分配方法的相对误差均低于等差分配和等比分配方法。

    图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
    9. 基于SiKuBERT与多元数据嵌入的中医古籍命名实体识别
    张文东, 吴子炜, 宋国昌, 等
    华南理工大学学报(自然科学版)    2024, 52 (6): 128-137.   DOI: 10.12141/j.issn.1000-565X.230143
    摘要151)   HTML4)    PDF(pc) (1115KB)(23)    收藏

    中医古籍命名实体识别是构建中医知识图谱的基础,对中医知识的提取与智能化呈现具有重要意义。然而,中医知识体系结构庞大,公开可用的语料库稀少且语义复杂,当前的研究大多关注字向量的表达,对特殊汉字的结构特征中丰富的语义特点考虑不充分;而且,由于汉字语义丰富,还存在潜在特征表达不足及一词多义的问题。文中结合中医古籍的语料特点与古汉字结构信息,提出了一种基于SiKuBERT与多元数据嵌入的命名实体识别方法,通过SiKuBERT创建字特征信息,在此基础上嵌入词特征与部首特征来捕捉汉字的语义信息,让具有相似部首序列的字符在空间向量中彼此接近。采用该方法对本草数据集中的人名、中草药物名,病症名、病理名、经络名进行识别,实验结果表明:文中方法能够有效抽取文本中的5类实体,F1值为86.66%,精确率达86.95%,召回率达86.37%;相较于基于字特征的SiKuBERT-CRF模型,文中方法融合了字词信息与繁体汉字的结构信息,能增强实体识别效果,总体F1值提升了2.83个百分点;此外,该方法对具有显著部首特征的中草药物名和病症名的识别效果最佳,相较于基于字特征的SiKuBERT-CRF模型,F1值分别提升了3.48和0.97个百分点。总体而言,文中方法的性能指标高于其他主流的深度学习模型,且具有良好的泛化能力。

    图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
    10. 基于鲲鹏和昇腾异构平台的单节点HPL-AI设计与优化
    吴昊天, 任长青, 陆璐, 等
    华南理工大学学报(自然科学版)    2024, 52 (2): 13-22.   DOI: 10.12141/j.issn.1000-565X.230066
    摘要126)   HTML4)    PDF(pc) (1989KB)(60)    收藏

    鉴于低精度浮点运算拥有更快的运算速度,越来越多的高性能应用采用混合精度方案进行加速,而同样采用该方案来加速的AI(人工智能)大模型也受到广泛关注。最近,HPL-AI(High Performance LINPACK for Accelerator Introspection)基准测试被提出,用于评估高性能系统的混合精度运算性能。针对该基准测试,本研究在鲲鹏和昇腾异构平台上设计并优化了单节点HPL-AI基准测试的实现。其主要通过循环任务分配的策略将任务均匀地分配给AI处理器以平衡AI处理器的负载;通过带间隔值的任务分配策略提高数据传输的连续性来减少CPU和AI处理器之间的数据传输时间;在不影响计算精度的情况下,通过取消数据缩放的策略来减少CPU侧的计算量。最终实验结果表明:当间隔值为8时,HPL-AI基准测试的混合精度浮点运算速度最快;同时,取消数据缩放不会对HPL-AI基准测试的结果精度产生影响;在鲲鹏和昇腾异构平台上,与非优化的HPL-AI基准测试方法相比,本研究提出的优化策略使混合精度浮点运算速度提升了29%左右,为单节点HPL-AI基准测试的进一步优化和部署多节点HPL-AI基准测试奠定了坚实的基础。

    图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
    11. 基于遗传算法的时间敏感网络调度方法
    陆以勤, 黄成海, 陈嘉睿, 等
    华南理工大学学报(自然科学版)    2024, 52 (2): 1-12.   DOI: 10.12141/j.issn.1000-565X.230032
    摘要763)   HTML2)    PDF(pc) (4196KB)(39)    收藏

    随着网络技术的进步,车载网、工业物联网以及5G超高可靠低时延通信(uRLLC)等应用都需要时间敏感网络(TSN)来保证超低延时的确定性数据传输。TSN流量调度需要快速且精确的调度算法,现有的精确式求解方法复杂度高,在大规模联合调度时无法满足实时性。文中设计了一种性能更优的路由优化遗传算法(Routing-GA),结合路由和流量调度约束,能通过优化路由来提高调度算法求解效率,为链路负载均衡调度提供服务。该策略增加了调度的求解空间以及求解灵活性,具备元启发式算法的快速求近最优解特点,能够简单有效地处理大规模TSN路由约束联合调度问题。Routing-GA以时间敏感流最小端到端时延作为优化目标,联合考虑路由和TSN约束,并针对TSN传输问题特性提供一种低复杂度、高效率和高拓展性的遗传算法编码方式。此外,为了提高调度算法的性能,提出针对路由长度及链路负载均衡进行优化的交叉变异机制。实验结果表明所实现的Routing-GA能有效减少端到端时延,显著提高求解质量,进化率可以达到24.42%,平均只需要传统遗传算法(GA)迭代运行时间的12%,从而有效提高了算法的求解性能,满足TSN调度的约束要求。

    图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
    12. 基于ECA注意力机制改进的EfficientNet-E模型的森林火灾识别
    周浪, 樊坤, 瞿华, 等
    华南理工大学学报(自然科学版)    2024, 52 (2): 42-49.   DOI: 10.12141/j.issn.1000-565X.230046
    摘要1035)   HTML2)    PDF(pc) (1918KB)(101)    收藏

    火灾的发生给社会带来了巨大损失,森林火灾防治任务日益迫切,而全球变暖的趋势使得这一问题更加复杂。深度学习在各行各业发挥着重要作用,大量模型也被不断地设计和提出,且模型改进的方式多种多样。文中提出了EfficientNet-E模型,它利用更为先进的ECA模块(高效通道注意力模块)来替换EfficientNet模型中的SE模块,通过增强注意力机制性能提升模型的性能。相较于SE模块,ECA模块更好地保留了传输中的信息,使得数据特征在传输过程中保留更充分,从而能够优化模型。为验证EfficientNet-E模型的性能,以及EfficientNet设计思想在森林火灾识别问题上相较于传统模型的优势,文中选取了经典模型中的代表——ResNet和DenseNet作为对照参考,并结合EfficientNet和EfficientNet-E进行了相关实验。实验选用3 303张森林火灾、非火灾和烟雾图片。多轮试验结果显示,EfficientNet-E在识别森林火灾数据上的效果要好于常规的经典深度学习模型,且相较于原始EfficientNet的平均准确率(89.28%),EfficientNet-E的平均准确率(90.04%)有所提升,标准差更小,训练稳定性也更好,从而证实了改进后的EfficientNet-E性能更加优良。

    图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
    13. 基于动态邻域采样的社交推荐模型
    蔡晓东, 周青松, 叶青
    华南理工大学学报(自然科学版)    2024, 52 (2): 32-41.   DOI: 10.12141/j.issn.1000-565X.230023
    摘要88)   HTML0)    PDF(pc) (1672KB)(22)    收藏

    基于图神经网络的社交推荐模型在提升推荐系统性能方面有不错的表现。但现有方法都忽略了被查询的目标用户和项目节点与其邻居节点间可能存在特征不匹配的问题,导致噪声的引入而降低了模型性能。为了解决该问题,文中提出一种社交推荐模型DNSSR。首先构建一个包含用户和项目多元关系的关系图谱,图节点间信息关联更丰富;然后利用动态邻域采样机制获得与目标查询对的特征更一致的邻居节点,减少了噪声信息;另外,为了进一步提高模型预测性能,设计了一种增强型图神经网络对采样后得到的关系子图进行建模,它可以区分不同邻居节点的重要性并选择更可靠的信息源,获得更鲁棒的用户和项目嵌入向量用于评分预测。实验结果表明:相比其他先进模型,该模型预测误差明显降低,证明了文中所提各项方法的有效性;尤其是动态邻域采样机制,若将其弃用,DNSSR在Ciao数据集上的RMSE(均方根误差)和MAE(平均绝对误差)指标将分别上升6.05%和7.31%,在Epinions数据集上则分别上升3.49%和5.41%,充分验证了其能有效降低噪声干扰、提高社交推荐模型的性能。

    图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
    14. 基于多尺度特征融合的互学习脱机手写数学公式识别
    付鹏斌, 徐宇, 杨惠荣
    华南理工大学学报(自然科学版)    2024, 52 (2): 23-31.   DOI: 10.12141/j.issn.1000-565X.230034
    摘要156)   HTML3)    PDF(pc) (1012KB)(36)    收藏

    脱机手写数学公式二维结构复杂,其中字符多变的尺度以及书写风格的变换不一都会增大手写数学公式识别的难度。文中提出了一个基于多尺度特征融合的互学习模型。首先,在编码阶段引入了多尺度特征融合的方式改进模型,以提升模型对公式中细粒度信息的提取能力以及加强对全局二维结构的语义信息理解;其次,引入了成对的手写体、打印体数据来进行互学习模型的训练,该模型包括解码器损失和上下文匹配损失,分别学习LaTeX语法以及手写体、打印体之间的语义不变性,提高模型对不同书写风格的鲁棒性,提升对公式整体信息的理解能力。在CROHME 2014/2016/2019数据集上进行实验验证,结果发现:引入多尺度特征融合机制后,表达式正确率分别达到55.25%、52.31%、53.72%;引入互学习机制后,表达式正确率分别达到55.43%、53.53%、53.79%;同时引入两种机制后,表达式正确率分别达到58.88%、55.10%、57.05%。经实验证明,文中提出的方法能够有效提取公式中不同尺度下的特征,并通过互学习机制克服手写风格不一、数据量少等问题。此外,在HME100K数据集上的实验结果也验证了文中提出模型的有效性。

    图表 | 参考文献 | 相关文章 | 多维度评价 | 评论0
通知公告
精彩推荐
阅读排行
下载排行
引用排行