信息发布→ 登录 注册 退出

怎么用Python将XML转换为YAML

发布时间:2025-12-16

点击量:
用 xmltodict + pyyaml 是最简洁可靠的 XML 转 YAML 方案:xmltodict 将 XML 解析为嵌套字典(属性转 @ 开头键,重复标签转列表),PyYAML 再格式化输出为可读 YAML;支持文件读写、UTF-8 编码和异常处理。

怎么用python将xml转换为yaml

用 Python 将 XML 转为 YAML,核心思路是:先解析 XML 成 Python 原生数据结构(如字典、列表),再用 YAML 库将其序列化输出。关键在于 XML 结构到嵌套字典的合理映射,而非简单字符串替换。

用 xmltodict + pyyaml 是最简洁可靠的方式

xmltodict 能把 XML 树直接转成接近 JSON 的嵌套字典(保留属性、文本、子元素关系),PyYAML 则负责把字典格式化输出为可读 YAML。两者配合,几行代码就能完成转换。

  • 安装依赖:pip install xmltodict pyyaml
  • 基础示例(字符串输入):

import xmltodict
import yaml
<p>xml_str = '''<person id="123">
<name>Alice</name>
<age>30</age>
<hobbies>
<hobby>reading</hobby>
<hobby>swimming</hobby>
</hobbies>
</person>'''</p><h1>解析 XML → OrderedDict → 转普通 dict(可选)</h1><p>data = xmltodict.parse(xml_str)</p><h1>输出为 YAML 字符串(默认不带引号,缩进2空格)</h1><p>yaml_str = yaml.dump(data, default_flow_style=False, indent=2, allow_unicode=True)
print(yaml_str)

处理常见 XML 特性:属性、文本混合、重复标签

xmltodict 默认把属性转为以 @ 开头的键(如 @id),把元素内纯文本转为 #text 键。这对多数场景足够清晰,但需注意以下情况:

立即学习“Python免费学习笔记(深入)”;

Gaga Gaga

曹越团队开发的AI视频生成工具

Gaga 1151 查看详情 Gaga
  • 若某元素只有文本(无子元素、无属性),它的值就是字符串,不是 {'#text': 'xxx'}
  • 若多个同名子元素(如多个 <hobby></hobby>),会被自动转为列表 —— 这正是 YAML 中数组的自然表示
  • 如果想把属性名去掉 @ 前缀或自定义键名,可在 parse() 时传入 attr_prefix=''attr_prefix='_' 等参数

从文件读取并写入 YAML 文件

实际使用中多为文件间转换,注意编码和异常处理:

  • 读 XML 文件建议用 encoding='utf-8' 显式指定编码
  • 写 YAML 文件时也用 encoding='utf-8',并设 allow_unicode=True 避免中文乱码
  • 可加 try/except 捕获解析失败(如 XML 格式错误)

import xmltodict
import yaml
<p>try:
with open('input.xml', encoding='utf-8') as f:
xml_data = f.read()
data = xmltodict.parse(xml_data)</p><pre class="brush:php;toolbar:false;">with open('output.yaml', 'w', encoding='utf-8') as f:
    yaml.dump(data, f, default_flow_style=False, indent=2, allow_unicode=True)

except Exception as e: print(f"转换失败:{e}")

替代方案:用标准库 xml.etree.ElementTree + 手动构建字典

如果不想引入第三方库(如受限环境),可用 Python 内置 xml.etree.ElementTree,但需自己递归遍历节点、处理属性/文本/子元素,并决定如何表示空元素或混合内容。工作量大、易出错,仅建议用于极简 XML 或学习目的。

  • 优点:零依赖
  • 缺点:不自动处理重复标签(需手动判断是否转列表)、不区分属性与子元素、对复杂结构(如 CDATA、命名空间)支持弱
  • 一般不推荐用于生产转换

基本上就这些。用 xmltodict + pyyaml 是目前最实用、稳定、可读性高的组合,能应对绝大多数真实 XML 场景,且代码干净易维护。

以上就是怎么用Python将XML转换为YAML的详细内容,更多请关注其它相关文章!


相关文章: 如何在 Windows 11 中启动游戏手柄设置  PHP中获取MongoDB服务器运行时间(Uptime)的专业指南  Python Sounddevice 音频卡顿问题解析与队列数据安全处理  深入理解Go语言中的指针类型:以*string为例  拼多多视频播放卡顿如何处理 拼多多视频播放优化技巧  UC浏览器如何安装插件 UC浏览器添加扩展程序详细教程【进阶】  J*a应用程序首次运行自动创建文件与目录的最佳实践  照顾宝贝2小游戏免费秒玩入口  C#如何安全地从用户上传的XML文件中读取数据? 验证与清理策略  sublime怎么预览Markdown渲染效果_Markdown Preview插件 for sublime教程  向日葵客户端怎么进行远程CentOS控制_向日葵客户端远程CentOS控制操作教程  QQ邮箱电脑版登录入口_QQ邮箱官方网站登录平台  解决Python logging 中 datefmt 导致时间戳固定不变的问题  PHP高效扁平化嵌套数组:使用array_merge与数组解包操作符  Tailwind CSS line-clamp 布局问题解析与修复指南  VS Code远程开发时如何处理文件权限问题  sublime如何只显示或隐藏特定类型文件_sublime侧边栏文件过滤  c++ dfs和bfs代码 c++深度广度优先搜索算法  Python异步编程实践:使用Binance API构建实时交易数据流  实现全屏滚动与导航点:专业教程  构建轻量级网站内部消息系统:Formspree 集成指南  Golang如何通过reflect获取匿名字段方法_Golang reflect匿名字段方法访问技巧  Linux如何构建多环境配置管理_Linux多环境配置方案  QQ邮箱在线登录平台 QQ邮箱个人邮箱网页版入口  痛风发作了怎么办? 快速止痛和后期饮食调理  谷歌浏览器浏览体验优化_谷歌浏览器新版直连永久可用提示  win11怎么查看应用耗电情况 Win11电池设置查看应用能耗排行榜【优化】  蛙漫2台版漫画地址 Manwa2正版网页版链接  J*aScript中高效清空DOM列表元素:解决for循环中断与任务管理问题  怎么去除衣服上的口红印_生活小妙招教你用酒精轻松擦除  深入理解Google Cloud Datastore查询:祖先路径与数据一致性  如何让 composer 信任自签名的 HTTPS 证书源?  精准捕获:如何在页面中监听除特定元素外的所有点击事件  谷歌浏览器如何快速清除某个网站的数据_Chrome网站缓存清理方法  Pandas DataFrame 高效批量赋值:告别循环与笛卡尔积误区  React项目中导航栏Logo自适应布局:避免裁剪与布局溢出  谷歌google账号注册详细步骤 谷歌账号注册官方教程  腾讯QQ邮箱官方网站_QQ邮箱网页版在线登录  护手霜蹭到袖口上了如何清洗? 怎样避免留下一圈油印?  如何提高微信支付的安全性_微信支付安全防护与设置建议  J*a ArrayList索引越界异常:动态构建列数据的高效策略  如何在J*a中使用Locale处理多语言环境  AO3最新官网入口公告_2025AO3镜像站实时查询方法  J*aScript生成器_j*ascript异步迭代  LINUX的I/O重定向是什么_深入理解LINUX中 >、>> 与 < 的区别  如何在复杂的电商平台中优雅地管理共享资源并确保正确重定向,使用spryker-shop/resource-share-page模块助你一臂之力  高德地图总提示网络异常怎么办 高德地图离线导航设置与网络排查方法  C++如何实现异步操作_C++11使用std::future和std::async进行异步编程  “在文档元素之后找到了标记”是什么错误? 检查并修复XML中多个根元素的3个方法  优化MinIO list_objects_v2 操作的性能瓶颈与最佳实践 

在线客服
服务热线

服务热线

4008988990

微信咨询
二维码
返回顶部
×二维码

截屏,微信识别二维码

打开微信

微信号已复制,请打开微信添加咨询详情!