信息发布→ 登录 注册 退出

怎么用Python将XML转换为YAML

发布时间:2025-12-16

点击量:
用 xmltodict + pyyaml 是最简洁可靠的 XML 转 YAML 方案:xmltodict 将 XML 解析为嵌套字典(属性转 @ 开头键,重复标签转列表),PyYAML 再格式化输出为可读 YAML;支持文件读写、UTF-8 编码和异常处理。

怎么用python将xml转换为yaml

用 Python 将 XML 转为 YAML,核心思路是:先解析 XML 成 Python 原生数据结构(如字典、列表),再用 YAML 库将其序列化输出。关键在于 XML 结构到嵌套字典的合理映射,而非简单字符串替换。

用 xmltodict + pyyaml 是最简洁可靠的方式

xmltodict 能把 XML 树直接转成接近 JSON 的嵌套字典(保留属性、文本、子元素关系),PyYAML 则负责把字典格式化输出为可读 YAML。两者配合,几行代码就能完成转换。

  • 安装依赖:pip install xmltodict pyyaml
  • 基础示例(字符串输入):

import xmltodict
import yaml
<p>xml_str = '''<person id="123">
<name>Alice</name>
<age>30</age>
<hobbies>
<hobby>reading</hobby>
<hobby>swimming</hobby>
</hobbies>
</person>'''</p><h1>解析 XML → OrderedDict → 转普通 dict(可选)</h1><p>data = xmltodict.parse(xml_str)</p><h1>输出为 YAML 字符串(默认不带引号,缩进2空格)</h1><p>yaml_str = yaml.dump(data, default_flow_style=False, indent=2, allow_unicode=True)
print(yaml_str)

处理常见 XML 特性:属性、文本混合、重复标签

xmltodict 默认把属性转为以 @ 开头的键(如 @id),把元素内纯文本转为 #text 键。这对多数场景足够清晰,但需注意以下情况:

立即学习“Python免费学习笔记(深入)”;

Gaga Gaga

曹越团队开发的AI视频生成工具

Gaga 1151 查看详情 Gaga
  • 若某元素只有文本(无子元素、无属性),它的值就是字符串,不是 {'#text': 'xxx'}
  • 若多个同名子元素(如多个 <hobby></hobby>),会被自动转为列表 —— 这正是 YAML 中数组的自然表示
  • 如果想把属性名去掉 @ 前缀或自定义键名,可在 parse() 时传入 attr_prefix=''attr_prefix='_' 等参数

从文件读取并写入 YAML 文件

实际使用中多为文件间转换,注意编码和异常处理:

  • 读 XML 文件建议用 encoding='utf-8' 显式指定编码
  • 写 YAML 文件时也用 encoding='utf-8',并设 allow_unicode=True 避免中文乱码
  • 可加 try/except 捕获解析失败(如 XML 格式错误)

import xmltodict
import yaml
<p>try:
with open('input.xml', encoding='utf-8') as f:
xml_data = f.read()
data = xmltodict.parse(xml_data)</p><pre class="brush:php;toolbar:false;">with open('output.yaml', 'w', encoding='utf-8') as f:
    yaml.dump(data, f, default_flow_style=False, indent=2, allow_unicode=True)

except Exception as e: print(f"转换失败:{e}")

替代方案:用标准库 xml.etree.ElementTree + 手动构建字典

如果不想引入第三方库(如受限环境),可用 Python 内置 xml.etree.ElementTree,但需自己递归遍历节点、处理属性/文本/子元素,并决定如何表示空元素或混合内容。工作量大、易出错,仅建议用于极简 XML 或学习目的。

  • 优点:零依赖
  • 缺点:不自动处理重复标签(需手动判断是否转列表)、不区分属性与子元素、对复杂结构(如 CDATA、命名空间)支持弱
  • 一般不推荐用于生产转换

基本上就这些。用 xmltodict + pyyaml 是目前最实用、稳定、可读性高的组合,能应对绝大多数真实 XML 场景,且代码干净易维护。

以上就是怎么用Python将XML转换为YAML的详细内容,更多请关注其它相关文章!


相关文章: HTML空白字符处理机制:渲染、DOM与编码实践  漫蛙漫画官方主页入口 漫蛙MANWA网页直达访问链接  蛙漫官方正版入口 蛙漫网页在线全集免费观看  Go语言中JSON数据解码与字段访问指南  css滚动动画效果怎么实现_使用Animate.css滚动触发动画类  一加 14R 快充无反应_一加 14R 充电优化  WooCommerce产品页高级定制:实现基于分类的交叉销售  ACG动漫视频网入口 ACG动漫*免费正版观看地址  Promise错误处理:在catch后终止链式then执行的策略  win11 Snap Layouts怎么用 Win11窗口布局与分屏多任务高效指南【必学】  汽水音乐车机版横屏版7.1 汽水音乐车机版横屏版下载入口  Win10如何开启蓝牙功能_Windows10找不到蓝牙开关解决方法  邮政快递单号查询入口 邮政快递物流信息在线查询入口  印象笔记如何设离线包出差查阅_印象笔记设离线包出差查阅【离线阅读】  Golang如何实现微服务鉴权与权限控制_Golang微服务鉴权与权限管理实践  C++如何实现异步操作_C++11使用std::future和std::async进行异步编程  限制HTML日期输入框的日期选择范围  基于动态规划的房屋花卉种植最小成本算法详解  韩小圈电脑版在线入口_网页版免费登录地址  sublime如何处理大型CSV文件的列对齐_sublime高级表格编辑插件指南  抖音商城签到领现金是真的吗_抖音商城签到奖励与提现说明  12306选座怎么选到商务座_12306商务座选择与配置说明  动漫花园资源网使用步骤_动漫花园资源网下载流程  如何在J*a中实现统一对象行为接口_项目大型化时的接口规范化  VS Code远程开发时如何处理文件权限问题  HTML5原生日期选择器与jQuery UI:实现日期选择器的联动与程序化控制  PDO预处理语句中冒号的正确处理:区分SQL函数格式与命名占位符  随机参数递归函数的基准调用次数与时间复杂度探究  星露谷物语官网入口 星露谷物语游戏官网入口  优化HTML表单样式:解决输入框焦点跳动与元素间距问题  LINUX怎么设置定时任务_LINUX crontab配置教程  漫蛙2正版漫画站 漫蛙2网页版快速访问入口  优化 Jest 模拟:强制未实现函数抛出错误以提升测试效率  Safari浏览器输入栏卡顿如何解决 Safari搜索建议与缓存清理  windows10怎么查看本机ip_windows10命令提示符ipconfig使用  怎样使用“本地安全策略”提升Windows安全性_Secpol.msc配置指南【高手】  深入理解字体排版:Adobe光学字偶距与CSS字偶距的差异与实现  sublime怎么进行远程开发编辑_配置rsub/rmate实现sublime编辑服务器文件  UC浏览器网页版登录入口官网 电脑版网址入口  必由学官网快捷入口 必由学网页版在线学习平台  Angular响应式表单:实现提交后表单及按钮的禁用与只读化  学习通网页版官方登录 超星学习通电脑端入口指南  c++20的std::jthread是什么_c++可中断线程与RAII式管理  电脑屏幕颜色不舒服怎么办_Windows夜间模式与色彩校准教程【护眼技巧】  C++如何进行游戏物理模拟_使用Box2D库为C++游戏添加2D物理效果  C++如何操作注册表_Windows平台下C++读写注册表的API函数详解  俄罗斯方块最新版入口 俄罗斯方块在线玩官网入口  LINUX怎么安装MySQL_LINUX数据库安装配置教程  向日葵客户端怎么进行远程CentOS控制_向日葵客户端远程CentOS控制操作教程  J*a中实现Go语言select通道多路复用机制 

在线客服
服务热线

服务热线

4008988990

微信咨询
二维码
返回顶部
×二维码

截屏,微信识别二维码

打开微信

微信号已复制,请打开微信添加咨询详情!