返回列表 发布新帖

混合相似性度量的仪表询价电子表格结构识别

7 0
admin 发表于 2024-12-14 12:32 | 查看全部 阅读模式

文档名:混合相似性度量的仪表询价电子表格结构识别
摘要:对仪表企业来说,快速高效地自动响应用户的询价请求,实现无人化询价,具有非常重要的意义.但不同用户提供的物料清单表无统一规范的格式,导致仪表企业只能获得半结构化的询价电子表格,无人化询价系统难以分析与理解.构建无人化询价系统的关键是准确地自动提取仪表参数,而提取参数的前提是正确理解表格结构.因此,以构建无人化询价系统为目标,研究仪表询价电子表格的结构识别,提出混合相似性度量表格结构识别方法(hybridsimi-laritymetricsfortablestructurerecognition,HSMTSR).所提方法结合Levenshtein距离、Dice系数和单元格类型相似度(celltypesimilarity,TySim),根据单元格和行数据的相似度解析识别表格结构.同时,建立流量仪表电子表格数据集(flowmeterspreadsheetdataset,FSDS)研究分析仪表询价电子表格的结构,包括714个电子表格,8574行数据.实际应用表明,所提方法可准确高效地自动识别多种复杂结构的仪表询价电子表格,并在多个评价指标上均取得较好效果.

Abstract:Forinstrumentationcompanies,itisofgreatsignificancetoquicklyandefficientlyautomatetheresponsetousers'requestforquotationandtorealizeunmannedquotation.Nevertheless,thereisnounifiedandstandardizedformatforthebillofmaterialsspreadsheetsprovidedbydifferentusers,resultinginsemi-structuredquotationspreadsheetsforinstrumentationcompaniesandcreatingdifficultiesforunmannedquotationsystemstoperformanalysis.Thekeytobuildinganunmannedquotationsystemistoaccuratelyautomatetheextractionofmeterparameters,whichpresupposesaproperunderstandingofthespreadsheetstructure.Therefore,withthegoalofbuildinganunmannedquotationsystem,thispaperstudiesthestructurerecognitionofinstrumentquotationspreadsheetsandproposeshybridsimilaritymetricsfortablestructurerecognition(HSMTSR).WithLevenshteindistance,Dicecoefficientandcelltypesimilarity(TySim),thisapproachidentifiesspreadsheetstructuresbasedonthesimilarityresolutionofcellandrowdata.Meanwhile,flowmeterspreadsheetdataset(FSDS)isbuilttoanalyzethestructureofmeterquotationspreadsheet,including714spreadsheetswith8574rowsofdata.Practicalapplicationsshowthemethodaccuratelyandefficientlyautomatestheidentificationofmultiplecomplexstructuresofinstrumentquotationspreadsheets,andachievessuperiorresultsinseveralevaluationmetrics.

作者:徐传运   马莹丽   李刚   舒涛   李星光 Author:XUChuanyun   MAYingli   LIGang   SHUTao   LIXingguang
作者单位:重庆理工大学两江人工智能学院,重庆401135;重庆师范大学计算机与信息科学学院,重庆401331重庆理工大学两江人工智能学院,重庆401135
刊名:重庆理工大学学报
Journal:JournalofChongqingInstituteofTechnology
年,卷(期):2024, 38(1)
分类号:TP391
关键词:电子表格  结构识别  相似性度量  类型相似度  仪表询价  
Keywords:spreadsheets  structurerecognition  similaritymetrics  typesimilarity  instrumentquo-tation  
机标分类号:
在线出版日期:2024年3月6日
基金项目:重庆市巴南区科委项目,重庆市科委项目,重庆市科委项目,重庆市教委项目,重庆理工大学研究生创新项目混合相似性度量的仪表询价电子表格结构识别[
期刊论文]  重庆理工大学学报--2024, 38(1)徐传运  马莹丽  李刚  舒涛  李星光对仪表企业来说,快速高效地自动响应用户的询价请求,实现无人化询价,具有非常重要的意义.但不同用户提供的物料清单表无统一规范的格式,导致仪表企业只能获得半结构化的询价电子表格,无人化询价系统难以分析与理解.构建...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

        混合相似性度量的仪表询价电子表格结构识别  Hybrid similarity metric for instrument quotation spreadsheet structure recognition

混合相似性度量的仪表询价电子表格结构识别.pdf
2024-12-14 12:32 上传
文件大小:
6.25 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号-1
关灯 返回顶部
快速回复 返回顶部 返回列表