用 xmltodict + pyyaml 是最简洁可靠的 XML 转 YAML 方案:xmltodict 将 XML 解析为嵌套字典(属性转 @ 开头键,重复标签转列表),PyYAML 再格式化输出为可读 YAML;支持文件读写、UTF-8 编码和异常处理。

用 Python 将 XML 转为 YAML,核心思路是:先解析 XML 成 Python 原生数据结构(如字典、列表),再用 YAML 库将其序列化输出。关键在于 XML 结构到嵌套字典的合理映射,而非简单字符串替换。
xmltodict 能把 XML 树直接转成接近 JSON 的嵌套字典(保留属性、文本、子元素关系),PyYAML 则负责把字典格式化输出为可读 YAML。两者配合,几行代码就能完成转换。
pip install xmltodict pyyaml
import xmltodict import yaml <p>xml_str = '''<person id="123"> <name>Alice</name> <age>30</age> <hobbies> <hobby>reading</hobby> <hobby>swimming</hobby> </hobbies> </person>'''</p><h1>解析 XML → OrderedDict → 转普通 dict(可选)</h1><p>data = xmltodict.parse(xml_str)</p><h1>输出为 YAML 字符串(默认不带引号,缩进2空格)</h1><p>yaml_str = yaml.dump(data, default_flow_style=False, indent=2, allow_unicode=True) print(yaml_str)
xmltodict 默认把属性转为以 @ 开头的键(如 @id),把元素内纯文本转为 #text 键。这对多数场景足够清晰,但需注意以下情况:
立即学习“Python免费学习笔记(深入)”;
Gaga
曹越团队开发的AI视频生成工具
1151
查看详情
{'#text': 'xxx'}
<hobby></hobby>),会被自动转为列表 —— 这正是 YAML 中数组的自然表示@ 前缀或自定义键名,可在 parse() 时传入 attr_prefix='' 或 attr_prefix='_' 等参数实际使用中多为文件间转换,注意编码和异常处理:
encoding='utf-8' 显式指定编码encoding='utf-8',并设 allow_unicode=True 避免中文乱码
import xmltodict
import yaml
<p>try:
with open('input.xml', encoding='utf-8') as f:
xml_data = f.read()
data = xmltodict.parse(xml_data)</p><pre class="brush:php;toolbar:false;">with open('output.yaml', 'w', encoding='utf-8') as f:
yaml.dump(data, f, default_flow_style=False, indent=2, allow_unicode=True)
except Exception as e: print(f"转换失败:{e}")
如果不想引入第三方库(如受限环境),可用 Python 内置 xml.etree.ElementTree,但需自己递归遍历节点、处理属性/文本/子元素,并决定如何表示空元素或混合内容。工作量大、易出错,仅建议用于极简 XML 或学习目的。
基本上就这些。用 xmltodict + pyyaml 是目前最实用、稳定、可读性高的组合,能应对绝大多数真实 XML 场景,且代码干净易维护。
以上就是怎么用Python将XML转换为YAML的详细内容,更多请关注其它相关文章!
相关文章:
如何在 Windows 11 中启动游戏手柄设置
PHP中获取MongoDB服务器运行时间(Uptime)的专业指南
Python Sounddevice 音频卡顿问题解析与队列数据安全处理
深入理解Go语言中的指针类型:以*string为例
拼多多视频播放卡顿如何处理 拼多多视频播放优化技巧
UC浏览器如何安装插件 UC浏览器添加扩展程序详细教程【进阶】
J*a应用程序首次运行自动创建文件与目录的最佳实践
照顾宝贝2小游戏免费秒玩入口
C#如何安全地从用户上传的XML文件中读取数据? 验证与清理策略
sublime怎么预览Markdown渲染效果_Markdown Preview插件 for sublime教程
向日葵客户端怎么进行远程CentOS控制_向日葵客户端远程CentOS控制操作教程
QQ邮箱电脑版登录入口_QQ邮箱官方网站登录平台
解决Python logging 中 datefmt 导致时间戳固定不变的问题
PHP高效扁平化嵌套数组:使用array_merge与数组解包操作符
Tailwind CSS line-clamp 布局问题解析与修复指南
VS Code远程开发时如何处理文件权限问题
sublime如何只显示或隐藏特定类型文件_sublime侧边栏文件过滤
c++ dfs和bfs代码 c++深度广度优先搜索算法
Python异步编程实践:使用Binance API构建实时交易数据流
实现全屏滚动与导航点:专业教程
构建轻量级网站内部消息系统:Formspree 集成指南
Golang如何通过reflect获取匿名字段方法_Golang reflect匿名字段方法访问技巧
Linux如何构建多环境配置管理_Linux多环境配置方案
QQ邮箱在线登录平台 QQ邮箱个人邮箱网页版入口
痛风发作了怎么办? 快速止痛和后期饮食调理
谷歌浏览器浏览体验优化_谷歌浏览器新版直连永久可用提示
win11怎么查看应用耗电情况 Win11电池设置查看应用能耗排行榜【优化】
蛙漫2台版漫画地址 Manwa2正版网页版链接
J*aScript中高效清空DOM列表元素:解决for循环中断与任务管理问题
怎么去除衣服上的口红印_生活小妙招教你用酒精轻松擦除
深入理解Google Cloud Datastore查询:祖先路径与数据一致性
如何让 composer 信任自签名的 HTTPS 证书源?
精准捕获:如何在页面中监听除特定元素外的所有点击事件
谷歌浏览器如何快速清除某个网站的数据_Chrome网站缓存清理方法
Pandas DataFrame 高效批量赋值:告别循环与笛卡尔积误区
React项目中导航栏Logo自适应布局:避免裁剪与布局溢出
谷歌google账号注册详细步骤 谷歌账号注册官方教程
腾讯QQ邮箱官方网站_QQ邮箱网页版在线登录
护手霜蹭到袖口上了如何清洗? 怎样避免留下一圈油印?
如何提高微信支付的安全性_微信支付安全防护与设置建议
J*a ArrayList索引越界异常:动态构建列数据的高效策略
如何在J*a中使用Locale处理多语言环境
AO3最新官网入口公告_2025AO3镜像站实时查询方法
J*aScript生成器_j*ascript异步迭代
LINUX的I/O重定向是什么_深入理解LINUX中 >、>> 与 < 的区别
如何在复杂的电商平台中优雅地管理共享资源并确保正确重定向,使用spryker-shop/resource-share-page模块助你一臂之力
高德地图总提示网络异常怎么办 高德地图离线导航设置与网络排查方法
C++如何实现异步操作_C++11使用std::future和std::async进行异步编程
“在文档元素之后找到了标记”是什么错误? 检查并修复XML中多个根元素的3个方法
优化MinIO list_objects_v2 操作的性能瓶颈与最佳实践