文档名:大语言模型驱动的交互式建筑设计新范式
摘要:随着社会对建筑设计质量要求越来越高,建筑设计软件也变得越来越专业和复杂.现在的设计软件不仅学习成本高,而且交互模式复杂.大语言模型(LLM)的最新突破使计算机清晰地理解人类自然语言指令,并准确生成代码语言具有可行性,有望为人与软件的交互范式提供新思路.因此,本文提出了LLM驱动的交互式建筑设计新范式——将设计师通过多次键鼠操作与设计软件交互转变为LLM根据设计师自然语言指令生成并执行API调用脚本的方式;提出了技术路线并验证了其在建筑设计场景落地的可能性.该技术路线包括:①LLM根据用户指令从API库中搜索与任务相关的API;②LLM基于指令和候选API摘要信息编写程序脚本并运行;③LLM根据来自软件环境、用户等反馈改进优化所编写的程序脚本.通过Rhino7设计软件、GPT-4和CodeLlaMa完成多个设计任务,测试当前LLM是否具备执行该技术路线各关键环节的能力.测试结果不仅证明了LLM驱动的交互式设计范式在建筑设计场景已初具落地前景,也为技术落地提供经验和建议.该设计范式的落地可以降低软件的使用门槛和学习成本,提高设计师工作效率;有望在未来的建筑设计软件中发挥重要作用.
Abstract:Associetyplaceshigherdemandsonthequalityofbuildingdesigns,designsoftwarehasbecomemoreprofessionalandcomplicated.Currentdesignsoftwarenotonlyincurshighlearningcostsbutalsofeaturescomplexinteractionmodes.Therecentbreakthroughsinlargelanguagemodels(LLM)haveenabledcomputerstoclearlycomprehendinstructionsbasedonhumannaturallanguageandaccuratelygeneratecode,whichisexpectedtoprovidenewideasfortheparadigmofhumaninteractionwithsoftware.Therefore,thisstudydesignedanewparadigmofinteractivebuildingdesigndrivenbyLLM,i.e.,shiftingfromthedesignersinteractingwiththedesignsoftwarethroughmultiplekeyboardandmouseoperationstoLLMswritingscriptstoinvokeAPIsaccordingtoarchitects'instructions.Themethodologywasproposedanditsimplementationfeasibilityinbuildingdesignwasvalidated.Themethodologyincluded:①LLMretrievedtask-relatedAPIsfromtheAPIsetaccordingtouserinstructions;②LLMwroteaprogramscriptbasedoninstructionsandtheabstractofcandidateAPIsandranit;③LLMrevisedthescriptwrittenbasedonthefeedbackfromtheenvironment,users,etc.TovalidatethecapabilitiesofcurrentLLMsinexecutingthekeystepsofthemethodology,multipledesigntaskswerecompletedwithRhino7designsoftware,GPT-4,andCodeLlaMa.TheresultsnotonlydemonstratedthattheLLM-driveninteractivedesignparadigmheldinitialprospectsforimplementationinbuildingdesign,butalsoprovidedexperiencesandsuggestionsforitsimplementation.Theimplementationofthisdesignparadigmcouldreducethethresholdandlearningcosts,improvingtheefficiencyinmanyscenarios,andwasexpectedtoplayakeyroleinfuturebuildingdesignsoftware.
作者:蒋灿 郑哲 梁雄 林佳瑞 马智亮 陆新征 Author:JIANGCan ZHENGZhe LIANGXiong LINJiarui MAZhiliang LUXinzheng
作者单位:广联达科技股份有限公司,北京100193;清华大学土木工程系,北京100084清华大学土木工程系,北京100084广联达科技股份有限公司,北京100193清华大学土木工程系,北京100084;住房城乡建设部数字建造与孪生重点实验室,北京100084
刊名:图学学报 ISTICPKU
Journal:JournalofGraphics
年,卷(期):2024, 45(3)
分类号:TP391
关键词:建筑设计软件 软件交互 大语言模型 应用程序接口 GPT-4 Rhino7 Ladybug
Keywords:buildingdesignsoftware interactionwithsoftware largelanguagemodel applicationprogramminginterface GPT-4 Rhino7 Ladybug
机标分类号:TP311.52F270.7F014.32
在线出版日期:2024年6月19日
基金项目:大语言模型驱动的交互式建筑设计新范式[
期刊论文] 图学学报--2024, 45(3)蒋灿 郑哲 梁雄 林佳瑞 马智亮 陆新征随着社会对建筑设计质量要求越来越高,建筑设计软件也变得越来越专业和复杂.现在的设计软件不仅学习成本高,而且交互模式复杂.大语言模型(LLM)的最新突破使计算机清晰地理解人类自然语言指令,并准确生成代码语言具有可行...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
大语言模型驱动的交互式建筑设计新范式 A new interaction paradigm for building design driven by large language model:proof of concept with Rhino7
大语言模型驱动的交互式建筑设计新范式.pdf
- 文件大小:
- 894.14 KB
- 下载次数:
- 60
-
高速下载
|