1 环境

操作系统:Windows10

Python版本:Python3.7

2 简介

实现多级目录差分,举例说明如下:

假设现有的目录结构如下:1、2、2.1、2.2、2.3、2.4、3、4、5、6、6.1、6.1.1、6.1.2、6.1.3、6.1.4、6.2、6.3、6.4、7、8、9、10。

经过差分后,得到的各级目录为:

一级目录:1、2、3、4、5、6、7、8、9、10

二级目录:2.1、2.2、2.3、2.4和6.1、6.2、6.3、6.4

三级目录:6.1.1、6.1.2、6.1.3、6.1.4

各级目录的名字假设以字符串的方式存放,且最后拆分出的各级目录单独存放。

3 实现原理

假设目录等级最多三级,那么我们如何实现呢?

我们可以通过给各级目录赋一个权重,然后计算出各个目录对应的权重值,进行比较之后,就可以得到各级目录的分类。

假设各级目录最多有1000个。

(1)一级目录的权重就为1,则一级目录的1到1000对应的权重就是1到1000。

1 ~ 1000 ==> 1 ~ 1000

一级目录所占的数值范围:1 ~ 1000

(2)二级目录的权重赋值如下:

1.1 ~ 1.100 ==> 1*1000+1 ~ 1*1000+100

2.1 ~ 2.100 ==> 2*1000+1 ~ 2*1000+100

'''''' ''''''

100.1 ~ 100.100 ==> 100*1000+1 ~ 100*1000+100

1000.1 ~ 1000.1000 ==> 1000*1000+1 ~ 1000*1000 + 1000

二级目录所占的数值范围:1000 ~ 1001000

(3) 三级目录的权重赋值如下:

1.1.1 ~ 1.1.100 ==> 1*1000000+1*1000+1 ~ 1*1000000+1*1000+100

1.1000.1 ~ 1.1000.1000 ==> 1*1000000+1000*1000+1~ 1*1000000+1000*1000+1000

1.2.1 ~ 1.2.1000 ==> 1*1000000+2*1000+1 ~ 1*1000000+2*1000+1000

最后,我们只需要将目录按照上述的公式计算出权重,就可以根据权重获得目录所在的目录结构是什么。

4 代码实现

测试数据:["1", "2", "2.1", "2.2", "2.3", "2.4", "3", "4", "5", "6", "6.1", "6.1.1", "6.1.2", "6.1.3", "6.1.4", "6.2", "6.3", "6.4", "7", "8", "9", "10"]

 # encoding: utf-8
import os
import sys
import logging # 设置logging.basicConfig()方法的参数和配置logging.basicConfig函数
FORMAT = '[%(funcName)s: %(lineno)d]: %(message)s'
LEVEL = logging.INFO
logging.basicConfig(level = LEVEL, format=FORMAT) '''
* 获取二级标题所在目录名
* 返回值:二级目录标题名
目录与数值对应关系:
1.1 ~ 1.100 ==> 1*1000+1 ~ 1*1000+100
2.1 ~ 2.100 ==> 2*1000+1 ~ 2*1000+100
'''
def judge_second_directory(get_num):
for i in range(1, 1001, 1):
if get_num > i * 1000 and get_num < (i+1)*1000:
return str(i) + ".1"
return None '''
* 获取三级标题所在目录名
* 返回值:三级目录标题名
目录与数值对应关系:
1.1.1 ~ 1.1.100 ==> 1*1000000+1*1000+1 ~ 1*1000000+1*1000+100
1.2.1 ~ 1.2.1000 ==> 1*1000000+2*1000+1 ~ 1*1000000+2*1000+1000
'''
def judge_three_directory(get_num):
ret_str = None
for i in range(1, 1001, 1):
# 判断二级标题
if get_num > i * 1000000 and get_num < (i+1)*1000000:
ret_str = str(i) + "."
for j in range(1, 1001, 1):
# 判断三级标题
if get_num > i*1000000 + j*1000 and get_num < i*1000000 + (j+1)*1000:
ret_str += str(j) + '.1'
return ret_str
return None '''
按目录进行分类:
分类原理:
(1) 一级目录:
1 ~ 1000 ==> 1 ~ 1000
一级目录所占的数字范围:1 ~ 1000
(2) 二级目录:
1.1 ~ 1.100 ==> 1*1000+1 ~ 1*1000+100
2.1 ~ 2.100 ==> 2*1000+1 ~ 2*1000+100
''''''
''''''
100.1 ~ 100.100 ==> 100*1000+1 ~ 100*1000+100
1000.1 ~ 1000.1000 ==> 1000*1000+1 ~ 1000*1000 + 1000
二级目录所占的数字范围:1000 ~ 1001000
(3) 三级目录:
1.1.1 ~ 1.1.100 ==> 1*1000000+1*1000+1 ~ 1*1000000+1*1000+100
1.1000.1 ~ 1.1000.1000 ==> 1*1000000+1000*1000+1000
1.2.1 ~ 1.2.1000 ==> 1*1000000+2*1000+1 ~ 1*1000000+2*1000+1000
'''
def dirctory_classify(directory_list):
parent_directory = []
second_directory = {}
three_directory = {}
for directory_item in directory_list:
num_list = directory_item.split(".")
# 开始按目录进行分类
if len(num_list) == 1: # 一级目录
parent_directory.append(directory_item)
elif len(num_list) == 2: # 二级目录
# 例:1.1 ==> 1*1000+1
get_num = int(num_list[0]) * 1000 + int(num_list[1])
dir_tmp = judge_second_directory(get_num)
if dir_tmp == None:
continue
if dir_tmp not in second_directory:
second_directory[dir_tmp] = [directory_item]
else:
tmp_list = second_directory[dir_tmp]
tmp_list.append(directory_item)
second_directory[dir_tmp] = tmp_list
elif len(num_list) == 3: # 三级目录
# 例:1.1.100 ==> 1*1000000+1*1000+100
get_num = int(num_list[0])*1000000 + int(num_list[1])*1000 + int(num_list[2])
dir_tmp = judge_three_directory(get_num)
if dir_tmp == None:
continue
if dir_tmp not in three_directory:
three_directory[dir_tmp] = [directory_item]
else:
tmp_list = three_directory[dir_tmp]
tmp_list.append(directory_item)
three_directory[dir_tmp] = tmp_list
else:
logging.error("这是一个超过三级目录的条目!!!!")
logging.error("num: %s" % directory_item)
return [parent_directory, second_directory, three_directory] if __name__ == '__main__':
original_data = ["", "", "2.1", "2.2", "2.3", "2.4", "", "", "", "", "6.1", "6.1.1", "6.1.2", "6.1.3", "6.1.4", "6.2", "6.3", "6.4", "", "", "", ""]
directory = dirctory_classify(original_data) parent_directory = directory[0]
second_directory = directory[1]
three_directory = directory[2] print ("一级目录:", parent_directory)
print ("二级目录:", second_directory)
print ("三级目录:", three_directory)

运行测试:

可以看出,测试结果符合预期,一共有三级目录。各级目录中的目录结构也划分了出来。

Python实现拆分多级目录的方式的更多相关文章

  1. Python之拆分目录

    成分目录的好习惯,使得代码保持整洁,为以后的代码管理提供方便. 一.概念 一般目录有以下几个: bin:程序入口,存放start文件. conf:存放固定的配置信息,比如:连接redis的配置信息.连 ...

  2. 洗礼灵魂,修炼python(78)--全栈项目实战篇(6)—— 多级目录菜单之地址管理系统

    相信各位都在在网上买过东西吧?那么今天我的主题就是写个在线购物系统,是不可能的,哈哈(后期确实有这个项目),那么购物都填写过快递地址吧?然后网上查个地址都有地址管理吧? 要求: 1.打印出省.市.县等 ...

  3. python 一次创建多级目录

    python 一次创建多级目录沙漠骆驼:qq音乐import osos.mkdirs('/home/user/app')

  4. python unittest单元测试框架-3用例执行顺序、多级目录、装饰器、fixtures

    1.用例执行顺序 unittest默认会按照ascii码的顺序,依次执行.类名--方法名排序,使用discover也是默认排序.如果不想使用默认排序,就使用testsuite测试集的方式. impor ...

  5. Python 按当前日期(年、月、日)创建多级目录的方法

    先看实际效果,现在时间2018.4.26 使用python脚本按照年月日生成多级目录,创建的目录可以将系统生成的日志文件放入其中,方便查阅,代码如下: #!/usr/bin/env python #c ...

  6. Linux杂谈: 树形显示多级目录--tree

    最近写博客的时候偶尔会需要将文件目录结构直观地列出来,例如python的包结构. 于是在网上搜了搜,发现了一个Linux下还不错的工具--tree tree 可以很直观地显示多级目录结构. 1. 安装 ...

  7. python文件操作【目录大全】

    总是记不住API.昨晚写的时候用到了这些,但是没记住,于是就索性整理一下吧: python中对文件.文件夹(文件操作函数)的操作需要涉及到os模块和shutil模块. 得到当前工作目录,即当前Pyth ...

  8. [转帖]Linux杂谈: 树形显示多级目录--tree

    Linux杂谈: 树形显示多级目录--tree https://www.cnblogs.com/tp1226/p/8456539.html tree -L 最近写博客的时候偶尔会需要将文件目录结构直观 ...

  9. PHP判断文件夹是否存在和创建文件夹的方法(递归创建多级目录)

    在开始之前,我先说明一下,可能许多朋友与我一样认为只要给一个路径,mkdir就可以创建文件夹,其实不是那样,单个的MKDIR只能创建一级目录,对于多级的就不行了,那如何用mkdir来创建呢?先我抄一段 ...

随机推荐

  1. Java中的Atomic包

    Atomic包的作用 方便程序员在多线程环境下,无锁的进行原子操作 Atomic包核心 Atomic包里的类基本都是使用Unsafe实现的包装类,核心操作是CAS原子操作: 关于CAS compare ...

  2. 三. 动态添加option选项

  3. 剑指Offer:二进制中1的个数

    题目:输入一个整数,输出该数二进制表示中1的个数. // 二进制中1的个数 #include <stdio.h> int wrong_count_1_bits(int n) // 错误解法 ...

  4. row cache lock

    SQL> col name format a30 SQL> select * from (select SAMPLE_TIME, SESSION_ID, NAME, P1, P2, P3, ...

  5. AngularJS入门基础PPT(附下载链接)

    学习了Angularjs有段时间,自己写了一个PPT,个人认为总结的非常全面,对于入门基础够了. 大致模块有:Angularjs简单介绍,Angularjs特性,hello world,Control ...

  6. 李维作答 《insideVCL》——李维实在很勤奋,而且勇于突破,从不以旧的内容充数

    (编者按)<Inside VCL(VCL核心架构剖析)>一书出版以来,众多热心读者给李维先生.博文视点公司.CSDN写来信件,有更多朋友在各个论坛上发表关于该书的言论.读者们不但盛赞该书, ...

  7. 学习笔记——Java包装类

    由于Java不能定义基本类型的对象,所以通过包装类提供了各种可用方法的封装. 这一部分的知识,需要能够通过查看Integer.Boolean.Byte.Character.Double.Number类 ...

  8. Spring Boot全局支持CORS(跨源请求)的配置方法

    http://blog.csdn.net/zhangchao19890805/article/details/53893735

  9. Session &amp;cookie introduction,usage

    Cookie 1)什么是Cookie?      服务器为了识别用户身份而临时存放在浏览器端的少量数据.     2)工作原理         浏览器访问服务器时,服务器将一些数据以set-cooki ...

  10. 前端 ----jQuery的属性操作

    04-jQuery的属性操作   jquery的属性操作模块分为四个部分:html属性操作,dom属性操作,类样式操作和值操作 html属性操作:是对html文档中的属性进行读取,设置和移除操作.比如 ...