Notebook
  • Study hard and make progress every day
  • Mouka
    • Windows Internal
      • Helper Functions(todo:)
      • Find Kernel Module Address
      • Patch Guard Oops
      • Hook SSDT(Shadow)
      • Restore SSDT(Shadow)
      • Misc
        • Volatile in C
    • AntiCheat
      • Inject Defense
      • Injection Method
    • DriverDevelopment
      • 20180625
      • 20180626-27
    • Python
      • Python Tricks
        • 内置 http 服务器
        • 函数作为变量
        • "is" vs "=="
        • 直接变量值交换
        • 计算代码执行时间
        • 函数参数分解
        • 打印Python字典
        • 命名元组代替class
        • get()方法访问字典
        • 字典排序
        • 一次检查多个标志
        • 合并两个字典
        • re.sub使用替换函数
    • Algorithms
      • Greedy
        • 使括号平衡的最小交换次数
        • 埃及分数
      • DynamicProgramming
        • 0-1 背包问题
      • LeetCode
        • Count Primes
  • Honey
    • Python笔记
      • lxml库
      • os库
      • json文件读写
      • Scrapy
        • Scrapy安装与开始项目
        • Scrapy-Xpath
Powered by GitBook
On this page
  1. Honey
  2. Python笔记

os库

os.path模块

  • os.walk 遍历一个文件夹下的全部文件和文件夹(包括子文件)

for root, dirs, files in os.walk(dirname, topdown=True):
  • os.listdir(dirname)找到一个文件内的全部文件夹和文件,不包括子文件夹中的内容,返回值为list

  • os.path.isdir(dirname)判断是文件夹还是文件

dirname = 'C:\\Users\\daiyifan\\Desktop\\daiyifan\\pcbaby\\data'
  • os.path.exits(dirname)判断某路径是否存在

  • os.makedirs(dirname)创造文件夹,包括文件夹内的子文件夹

  • os.makedir(dirnam)创造文件夹,但上一层级的文件夹不存在会报错

  • 将html文件写入本地时候,应判断该文件夹是否存在(参见pcbaby)

def download_html(path,response):
    print(path)
    filename = path.split("/")[-1]
    print(filename)
    path = path.replace('https://', "")
    path = re.sub(r'/\d*\.html', '', path)
    path = "data/" + path
    if os.path.exists(path):
        print("该路径已存在")
    else:
        os.makedirs(path)
    with open(path + "/" + filename, "wb") as f:
        f.write(response.body)

Previouslxml库Nextjson文件读写

Last updated 6 years ago