文档名:混合相似性度量的仪表询价电子表格结构识别
摘要:对仪表企业来说,快速高效地自动响应用户的询价请求,实现无人化询价,具有非常重要的意义.但不同用户提供的物料清单表无统一规范的格式,导致仪表企业只能获得半结构化的询价电子表格,无人化询价系统难以分析与理解.构建无人化询价系统的关键是准确地自动提取仪表参数,而提取参数的前提是正确理解表格结构.因此,以构建无人化询价系统为目标,研究仪表询价电子表格的结构识别,提出混合相似性度量表格结构识别方法(hybridsimi-laritymetricsfortablestructurerecognition,HSMTSR).所提方法结合Levenshtein距离、Dice系数和单元格类型相似度(celltypesimilarity,TySim),根据单元格和行数据的相似度解析识别表格结构.同时,建立流量仪表电子表格数据集(flowmeterspreadsheetdataset,FSDS)研究分析仪表询价电子表格的结构,包括714个电子表格,8574行数据.实际应用表明,所提方法可准确高效地自动识别多种复杂结构的仪表询价电子表格,并在多个评价指标上均取得较好效果.
Abstract:Forinstrumentationcompanies,itisofgreatsignificancetoquicklyandefficientlyautomatetheresponsetousers'requestforquotationandtorealizeunmannedquotation.Nevertheless,thereisnounifiedandstandardizedformatforthebillofmaterialsspreadsheetsprovidedbydifferentusers,resultinginsemi-structuredquotationspreadsheetsforinstrumentationcompaniesandcreatingdifficultiesforunmannedquotationsystemstoperformanalysis.Thekeytobuildinganunmannedquotationsystemistoaccuratelyautomatetheextractionofmeterparameters,whichpresupposesaproperunderstandingofthespreadsheetstructure.Therefore,withthegoalofbuildinganunmannedquotationsystem,thispaperstudiesthestructurerecognitionofinstrumentquotationspreadsheetsandproposeshybridsimilaritymetricsfortablestructurerecognition(HSMTSR).WithLevenshteindistance,Dicecoefficientandcelltypesimilarity(TySim),thisapproachidentifiesspreadsheetstructuresbasedonthesimilarityresolutionofcellandrowdata.Meanwhile,flowmeterspreadsheetdataset(FSDS)isbuilttoanalyzethestructureofmeterquotationspreadsheet,including714spreadsheetswith8574rowsofdata.Practicalapplicationsshowthemethodaccuratelyandefficientlyautomatestheidentificationofmultiplecomplexstructuresofinstrumentquotationspreadsheets,andachievessuperiorresultsinseveralevaluationmetrics.
作者:徐传运 马莹丽 李刚 舒涛 李星光 Author:XUChuanyun MAYingli LIGang SHUTao LIXingguang
作者单位:重庆理工大学两江人工智能学院,重庆401135;重庆师范大学计算机与信息科学学院,重庆401331重庆理工大学两江人工智能学院,重庆401135
刊名:重庆理工大学学报
Journal:JournalofChongqingInstituteofTechnology
年,卷(期):2024, 38(1)
分类号:TP391
关键词:电子表格 结构识别 相似性度量 类型相似度 仪表询价
Keywords:spreadsheets structurerecognition similaritymetrics typesimilarity instrumentquo-tation
机标分类号:
在线出版日期:2024年3月6日
基金项目:重庆市巴南区科委项目,重庆市科委项目,重庆市科委项目,重庆市教委项目,重庆理工大学研究生创新项目混合相似性度量的仪表询价电子表格结构识别[
期刊论文] 重庆理工大学学报--2024, 38(1)徐传运 马莹丽 李刚 舒涛 李星光对仪表企业来说,快速高效地自动响应用户的询价请求,实现无人化询价,具有非常重要的意义.但不同用户提供的物料清单表无统一规范的格式,导致仪表企业只能获得半结构化的询价电子表格,无人化询价系统难以分析与理解.构建...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
混合相似性度量的仪表询价电子表格结构识别 Hybrid similarity metric for instrument quotation spreadsheet structure recognition
混合相似性度量的仪表询价电子表格结构识别.pdf
- 文件大小:
- 6.25 MB
- 下载次数:
- 60
-
高速下载
|