网站访问量
今日访问量: 0
大语言模型语义不变的推理优化技术综述
严昱瑾;田兆星;周冠霖;张艳敏;梅锋;Transformer架构使大语言模型在自然语言处理、信息检索、多语言支持及多模态任务中均呈现出优异性能。但模型的参数量与复杂性在推理阶段带来了计算和内存方面的挑战。针对这一问题,研究者提出了多种优化技术。其中,基于语义不变性的推理优化技术,旨在提升推理效率、降低资源消耗的同时,保持模型的语言理解与生成能力。本文系统综述了低比特量化、核函数优化、并行计算方法、内存管理与调度等优化手段,重点剖析了这些技术的理论基础、具体实现方式及其对推理速度和模型性能产生的影响。综合运用上述优化技术,能够在显著提升推理效率的同时,保障模型输出高质量语义,为大语言模型在实际应用中的广泛部署提供有力支撑。
基于FA-BP神经网络的第四系地下水赋存层位判别研究
汪洋;梁爽;庞国兴;董明奇;郝印博;王俊鹏;刘敏;叶莹莹;为了解决第四系地下水化学特征类似而难以区分的问题,本文提出一种基于FA-BP神经网络的第四系地下水赋存层位判别模型。以唐山市平原区第四系地下水为例,筛选了来自研究区第四系浅层和深层地下水样品,选用pH、TDS、Na、Ca、Mg、HCO3、Cl、SO4、F、Mn、Se、Cu、Zn、Al 14种水化学指标作为判别因子,考虑第四系浅、深层地下水的水质边界不明显和水化学组分差异性不大的特点,使用因子分析算法对数据进行降维,提取4个公因子作为判别因子,联合BP神经网络模型,建立基于FA-BP神经网络的第四系地下水赋存层位判别模型。为了验证模型的可靠性和准确性,将其判别结果与BP神经网络模型进行分析比较,并利用工作特征曲线进行了衡量验证。结果表明:FA-BP神经网络模型综合判别准确率达到93.2%,BP神经网络模型综合判别准确率为73.2%;二者判别结果的ROC(receiver operating characteristic)曲线下面积值分别为0.972、0.890。这说明采用基于FA-BP神经网络模型的判别结果与实际赋水层位类别吻合率高,研究成果为第四系地下水赋存层位判别研究提供一种新方法。
2005—2024年内蒙古汛期小时降水时空变化特征
乌尼尔;张波;姜湖园;特日格勒;伊德尔呼;曲学斌;为深入了解气候变暖背景下的内蒙古降水时空分布及变化特征,提升水资源管理能力,本文采用2005—2024年汛期内蒙古107个气象站逐小时降水量数据,结合地理探测器等方法开展研究。结果表明,内蒙古的平均降水量为0.101 mm,平均降水频率为6.2%,平均强度为1.59 mm,高值区主要集中在大兴安岭及其东南麓地区;大兴安岭北部地区虽然降水频率较高,但雨强相对较小,而大兴安岭东南麓及阴山山脉以南的部分地区则是降水强度的大值区和强降水的易发区。内蒙古降水的空间分布受经纬度、高程和坡向及坡度等地理因子影响,其中海陆距离差异对降水分布的解释力最大。汛期降水主要集中在午后和凌晨时段,午后降水对雨量的贡献最大,且平均降水量的年内分布以7月中旬为轴对称递减;东、中部地区的强降水多出现在午后,西部地区午后和凌晨时段的强降水出现概率相近。内蒙古东部地区降水量级和频率存在显著增加,而西部地区强降水事件呈现较明显的增加趋势。
深层盐穴储能井注采交变工况下水泥环疲劳损伤数值模拟研究
鲁俊;刁皓玉;班凡生;周念涛;林元华;刘浩生;付盼;王江帅;任茜钰;针对深层盐穴储能井在交变工况下的水泥环疲劳损伤的完整性问题,本文基于内聚力单元理论与扩展有限元方法,构建套管-水泥环-套管组合体完整性有限元分析模型,系统研究交变压力与温度对水泥环疲劳损伤的影响规律。结果表明:通过实验验证,该模型能够有效模拟水泥环失效过程;交变压力峰值与循环次数显著影响水泥环界面胶结及本体完整性,高压力峰值加速胶结失效进程,大尺寸套管结构在相同压力下界面损伤更为明显,且水泥环拉伸损伤程度高于压缩损伤,并随着后续循环周次的增加,失效的胶结面逐渐拓展和延伸;在温度跨度较大的区间内,交变温度加剧水泥环损伤,界面胶结失效循环周次随温度峰值升高而缩短,大尺寸套管对高温环境更为敏感,致使内壁率先发生失效并向外扩展,直至延伸至水泥环外壁;此外,第一界面相较于第二界面更易发生胶结失效。本文成果可为深层盐穴储能井中套管完整性评估及水泥环失效预防提供了重要理论依据与技术支撑。
基于模态应变能变化率的攀登安全钩损伤识别方法
郭俊龙;陈英;张帆;本文针对基于模型修正的攀登安全钩内部损伤识别过程复杂、计算量大的问题,构建模态应变能变化率指标,对一款攀登安全钩进行了损伤识别数值仿真和试验验证。仿真结果表明,模态应变能变化率指标仅在损伤位置发生了变化,且变化程度随损伤程度不同而改变。最后,将该指标应用于攀登安全钩损伤识别的试验研究中,通过实测数据验证了该指标的有效性,填补了攀登安全钩损伤识别领域的空白。
基于集成学习的地震救援物资需求预测研究
常艳艳;曾智刚;杜琳;张兴浩;地震灾害等突发事件对人类社会造成严重威胁,多种因素的不确定性导致应急救援生活保障物资需求量具有强烈的不确定性,准确预测应急物资需求量一直是亟需解决的难题。本文以震后各类生活保障物资为研究对象,融合多种机器学习模型的优点,构建了面向物资需求预测的异构集成框架,设计了“交叉验证+网格搜索”的双层优化机制,利用实际数据进行案例分析,并将本方法与9类基线模型进行对比,通过消融实验揭示了初级学习器的动态交互机制。结果表明:相较于基线模型,本模型在平均绝对百分比误差(mean absolute percentage error,MAPE)方面降低了5.65%~87.28%,预测结果准确性较高,能够为应急救援提供方法支撑和决策依据。
微信公众号

公告栏
作者在网站投稿成功后,编辑部及时进行初审,不符我刊发表的稿件发送“退稿通知单”,录用稿件逐期安排刊登,并付相应稿酬。
稿件投稿后,审稿周期一般为2~3个月。请随时关注系统并按照要求上传修改稿件,也可以拨打电话0571-85183079咨询。
《科技通报》欢迎您的来稿,欢迎订阅。
期刊信息
月刊
1985年创刊
主管、主办
浙江省科学技术协会
编辑出版
《科技通报》编辑部
电 话
0571-85183079
投稿网址
联系邮箱
联系地址
浙江省杭州市西湖文化广场省科技馆6楼
主编:刘志强
编辑部主任:孟佳菲
编辑:徐丹 吴頔
ISSN 1001-7199
CN 33-1079/N
广告许可证号
330100400130