信息发布→ 登录 注册 退出

Python 文件批量分类存储案例

发布时间:2025-11-18

点击量:
使用Python可自动按扩展名分类文件:通过os和shutil模块遍历“待整理文件”目录,根据预定义的file_categories映射关系,将.txt、.jpg等文件分别移入“文本文件”“图片文件”等子文件夹,未匹配的归入“其他文件”,实现高效批量整理。

python 文件批量分类存储案例

在日常工作中,我们经常需要将大量文件按照特定规则分类存储。Python 提供了强大的文件操作能力,可以轻松实现文件的批量分类整理。下面通过一个实际案例,展示如何使用 Python 将指定目录中的文件按扩展名自动归类到不同的子文件夹中。

需求说明

假设有一个名为 "待整理文件" 的文件夹,里面混杂着多种类型的文件(如 .txt、.jpg、.pdf 等)。我们的目标是编写一段 Python 脚本,自动读取该文件夹中的所有文件,并根据文件后缀名创建对应的分类文件夹(如 "文本文件" 对应 .txt,"图片文件" 对应 .jpg/.png 等),然后将文件移动进去。

实现步骤

以下是完成该任务的关键步骤和代码逻辑:

1. 导入所需模块

使用 osshutil 模块进行路径操作和文件移动:

  • os:用于遍历文件、判断路径是否存在
  • shutil:用于移动文件

2. 定义文件类型映射

建立扩展名与目标文件夹名称的映射关系,便于统一管理:

装修公司企业网站源码2.0 装修公司企业网站源码2.0

装修公司源码,采用DIV+CSS布局,首页顶部采用了超大宽屏banner焦点图切换,带伸缩功能的导航条。首页信息展示量大,有利于SEO优化,首页版块包括,导航,焦点图切换,案例,行业动态,装修经验,装修知识。源码支持伪静态,后台开启即可,服务器必须支持rewrite功能,否则无法实现伪静态功能。信息支持二级分类。后台支持信息批量修改,删除,可以支持,视频,图片,附件上传。

装修公司企业网站源码2.0 0 查看详情 装修公司企业网站源码2.0
file_categories = {
    '文本文件': ['.txt', '.log'],
    '图片文件': ['.jpg', '.jpeg', '.png', '.gif', '.bmp'],
    '文档文件': ['.pdf', '.doc', '.docx', '.ppt', '.pptx'],
    '表格文件': ['.xls', '.xlsx', '.csv'],
    '音频文件': ['.mp3', '.w*', '.aac'],
    '视频文件': ['.mp4', '.*i', '.mkv']
}

3. 遍历并分类文件

扫描源目录中的每个文件,提取扩展名,匹配分类,然后移动到对应文件夹:

  • 使用 os.listdir 获取所有文件名
  • 用 os.path.splitext 分离文件名和扩展名
  • 根据扩展名查找所属分类
  • 若目标文件夹不存在,则创建
  • 使用 shutil.move 移动文件

完整代码示例

以下是一个可直接运行的脚本模板:

import os
import shutil
<h1>源文件夹路径</h1><p>source_dir = '待整理文件'</p><h1>文件分类映射</h1><p>file_categories = {
'文本文件': ['.txt', '.log'],
'图片文件': ['.jpg', '.jpeg', '.png', '.gif', '.bmp'],
'文档文件': ['.pdf', '.doc', '.docx', '.ppt', '.pptx'],
'表格文件': ['.xls', '.xlsx', '.csv'],
'音频文件': ['.mp3', '.w*', '.aac'],
'视频文件': ['.mp4', '.*i', '.mkv']
}</p><h1>遍历源目录</h1><p>for filename in os.listdir(source_dir):
file_path = os.path.join(source_dir, filename)</p><pre class="brush:php;toolbar:false;"># 确保是文件而不是文件夹
if os.path.isfile(file_path):
    # 获取小写扩展名
    _, ext = os.path.splitext(filename)
    ext = ext.lower()

    # 匹配分类
    moved = False
    for folder_name, extensions in file_categories.items():
        if ext in extensions:
            target_folder = os.path.join(source_dir, folder_name)
            if not os.path.exists(target_folder):
                os.makedirs(target_folder)
            shutil.move(file_path, os.path.join(target_folder, filename))
            moved = True
            break

    # 其他未定义类型归入“其他文件”
    if not moved:
        other_folder = os.path.join(source_dir, '其他文件')
        if not os.path.exists(other_folder):
            os.makedirs(other_folder)
        shutil.move(file_path, os.path.join(other_folder, filename))

print("文件分类整理完成!")

使用建议

这个脚本可以根据实际需求灵活调整:

  • 修改 source_dir 指向你的目标文件夹
  • 增减 file_categories 中的类别和扩展名
  • 可加入日志记录或异常处理增强稳定性
  • 结合定时任务实现自动化整理

基本上就这些。不复杂但容易忽略细节,比如扩展名大小写、文件夹重复创建等问题,只要提前考虑清楚,就能让文件管理变得更高效。

以上就是Python 文件批量分类存储案例的详细内容,更多请关注其它相关文章!


相关文章: 在Go Martini框架中高效服务动态生成图像的实践指南  AO3官方镜像站点汇总 AO3同人作品网页版直达链接  qq浏览器如何查看和导出已保存的密码 qq浏览器密码管理器数据备份教程  高德地图家和公司地址在哪设置 高德地图通勤路线设置方法【超详细】  从OpenAI API响应中高效提取生成文本  支付宝解绑银行卡步骤_支付宝如何解除绑定银行卡  Win11 USB传输速度慢怎么解决 Win11 USB驱动更新与设置  怎样在Excel中做仪表盘_Excel仪表盘设计与关键指标展示方法  随机参数递归函数的基准调用次数与时间复杂度探究  Composer的 COMPOSER_PROCESS_TIMEOUT 配置项有什么用_解决因执行时间过长而失败的Composer脚本  自定义Bag-of-Words实现:处理带负号的词汇权重  mysql如何分析事务日志_mysql事务日志分析方法  没有大陆身份证/银行卡如何实名微信? 亲测有效的几种方法分享  钉钉视频会议画面卡顿如何解决 钉钉会议画面优化方法  Win10系统服务哪些可以禁用 Win10安全优化服务列表【干货】  Golang如何通过reflect获取匿名字段方法_Golang reflect匿名字段方法访问技巧  CSS子选择器:如何区分并样式化嵌套列表的子层级  如何修改开机登录密码_Windows账户安全设置超详细教程【必学】  b站如何看历史记录_b站观看历史找回方法  Golang如何实现容器化日志收集与分析_Golang容器日志收集分析方法  mc.js免安装版 mc.js一键畅玩入口  Yandex搜索引擎官方地址 俄罗斯网络世界的主要入口  age动漫网站入口 age动漫官网直接访问入口  怎么在html里运行vbs脚本_html中运行vbs脚本方法【教程】  1688商家版怎样分析买家画像精准供货_1688商家版分析买家画像精准供货【供货策略】  内存检查:在VS Code中调试C++时的内存视图  微博网页版官方账号登录 微博网页版内容浏览使用指南  如何高效处理PHP中的Excel数据导入导出?PortPHP/Spreadsheet助你轻松搞定!  Go RPC HTTP服务正确实现与常见陷阱解析  Kafka Streams中基于消息头条件过滤消息的实现指南  优化MinIO list_objects_v2 操作的性能瓶颈与最佳实践  印象笔记如何设离线包出差查阅_印象笔记设离线包出差查阅【离线阅读】  J*aScript数据结构转换:将对象数组按类别分组  J*aScript设计模式实践_j*ascript代码优化  Go语言中Map值调用指针接收器方法的限制与应对  在WordPress中通过REST API获取BasicAuth保护的远程文章  深入理解J*a编译器的兼容性选项:从-source到--release  Flexbox布局实践:实现粘性导航栏与底部固定页脚  LINUX的I/O重定向是什么_深入理解LINUX中 >、>> 与 < 的区别  zookeeper 都有哪些功能?  格力空气能E5故障代码是什么情况_格力空气能E5代码解析与应对措施  qq邮箱日历功能怎么用_创建日程与会议邀请的技巧  React Router 嵌套组件中 URL 重定向问题的解决方案  WooCommerce产品页高级定制:实现基于分类的交叉销售  生成rdflib自定义SPARQL函数:参数匹配与实践指南  poki网页游戏推荐_poki免费游戏平台入口  蛙漫漫画官网在线入口 蛙漫全本漫画免费阅读平台  哔哩哔哩忘记密码了怎么找回_哔哩哔哩密码找回方法  Go语言:非阻塞式判断标准输入(os.Stdin)是否有数据  快手极速版在线观看 官方网页版登录地址 

在线客服
服务热线

服务热线

4008988990

微信咨询
二维码
返回顶部
×二维码

截屏,微信识别二维码

打开微信

微信号已复制,请打开微信添加咨询详情!