password
AI summary
type
status
date
slug
summary
tags
category
icon
AI批量文件分析脚本(大学生狂喜版)
使用多个 OpenAI API 密钥并发地分析指定文件夹中的文件,并将分析结果保存到 JSON 文件中(可用于批批量识别文献,进行文献数据标识预处理,在进行文献综述书写)
💄 功能特性
- 读取 API 密钥: 从
token_file
文件中读取多个 OpenAI API 密钥。
- 并发处理文件: 使用线程池
concurrent.futures.ThreadPoolExecutor
并发地处理指定文件夹中的文件。 - 每个线程使用一个 API 密钥发送请求。
process_file_task
函数负责处理分配给每个线程的文件列表。
- 文件分析:
process_file
函数读取文件内容,将其转换为 Base64 编码,并调用send_file_to_api
函数发送到 OpenAI API 进行分析。send_file_to_api
函数构建请求体,包括模型、提示和文件内容,发送 POST 请求到 OpenAI API。- 如果请求失败,则进行重试,最多重试
request_tries
次。
- 结果保存: 将每个文件的分析结果保存到
json_name
文件中,每个文件对应一个 JSON 对象,包含文件名和分析结果。
- 日志记录: 使用
logging
模块记录程序运行过程中的日志信息,包括处理的文件数、成功数、失败数、耗时等。
🧑💻 代码样式
- 作者:Clivia
- 链接:Clivia的博客/technology/ai_recognize
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。
相关文章