80GJSON文件按照指定大小分割代码

import os


def split_large_json(input_file_path, output_dir, max_size_mb=100):
    """
    拆分大型JSON文件为多个小文件(按大小分割)

    参数:
        input_file_path: 输入JSON文件的完整路径
        output_dir: 输出目录的完整路径
        max_size_mb: 每个分片的最大大小(MB),默认为100MB
    """
    # 确保输出目录存在
    os.makedirs(output_dir, exist_ok=True)

    # 获取输入文件名(不带扩展名)
    input_filename = os.path.splitext(os.path.basename(input_file_path))[0]

    max_size = max_size_mb * 1024 * 1024  # 转换为字节
    part_num = 1
    current_size = 0
    output_file = None

    with open(input_file_path, 'r', encoding='utf-8') as infile:
        for line in infile:
            if output_file is None or current_size >= max_size:
                if output_file is not None:
                    output_file.close()
                # 构建包含完整路径的输出文件名
                output_filename = os.path.join(output_dir, f"{input_filename}_part{part_num}.json")
                output_file = open(output_filename, 'w', encoding='utf-8')
                part_num += 1
                current_size = 0

            output_file.write(line)
            current_size += len(line.encode('utf-8'))

    if output_file is not None:
        output_file.close()


# 使用示例
if __name__ == "__main__":
    # 输入文件路径(请替换为实际路径)
    input_json = "E:/八楼mangodb/device-sms.smsMessageHistory.json"

    # 输出目录路径(请替换为实际路径)
    output_directory = "E:/八楼分割"

    # 调用函数进行分割
    split_large_json(input_file_path=input_json,
                     output_dir=output_directory,
                     max_size_mb=100)

07-26
### Gson 库的使用与常见问题 Gson 是 Google 提供的一个用于在 Java 对象与 JSON 格式之间进行转换的开源库。它广泛用于 REST API 交互、配置文件解析等场景。尽管 Gson 是一个功能强大且易于使用的库,但在实际使用中仍可能遇到一些常见问题或需要遵循最佳实践。 #### 1. Gson 的基本使用 Gson 提供了两种主要操作方式:序列化(Java 对象转 JSON 字符串)和反序列化(JSON 字符串转 Java 对象)。以下是一个简单的示例: ```java import com.google.gson.Gson; public class GsonExample { static class User { String name; int age; } public static void main(String[] args) { Gson gson = new Gson(); // 序列化 User user = new User(); user.name = "Alice"; user.age = 30; String json = gson.toJson(user); System.out.println(json); // 输出: {"name":"Alice","age":30} // 反序列化 String jsonInput = "{\"name\":\"Bob\",\"age\":25}"; User parsedUser = gson.fromJson(jsonInput, User.class); System.out.println(parsedUser.name); // 输出: Bob } } ``` #### 2. 使用 Gson 时的常见问题 - **字段命名不一致问题** 如果 JSON 字段名与 Java 类的字段名不一致,可以通过 `@SerializedName` 注解指定映射关系: ```java public class User { @SerializedName("user_name") String name; } ``` - **空值处理** 默认情况下,Gson 会将 `null` 值序列化为 JSON 中的 `null`。如果希望忽略 `null` 字段,可以使用 `GsonBuilder` 构建 Gson 实例: ```java Gson gson = new GsonBuilder().serializeNulls().create(); ``` - **泛型类型反序列化** 反序列化泛型类型时,不能直接使用 `List.class`,而应使用 `TypeToken`: ```java String jsonList = "[{\"name\":\"John\"}]"; Type listType = new TypeToken<List<User>>(){}.getType(); List<User> users = new Gson().fromJson(jsonList, listType); ``` #### 3. Gson 与 JJWT 的集成 在使用 JJWT(Java JWT)库时,如果希望使用自定义的 Gson 实例而不是默认的 Jackson,可以进行如下配置: ```java JwtBuilder jwtBuilder = Jwts.builder() .setHeaderParam("typ", "JWT") .claim("username", "admin") .signWith(SignatureAlgorithm.HS256, "secretKey".getBytes()) .setHeaderJson(gson.toJson(headerMap)); // 使用自定义 Gson 实例 ``` 此方式可以确保在处理 JWT 的 JSON 数据时使用一致的序列化/反序列化逻辑[^2]。 #### 4. Gson 的性能优化建议 - **避免频繁创建 Gson 实例** Gson 实例是线程安全的,应尽量复用而非每次创建。 - **使用 `@Expose` 注解控制序列化/反序列化字段** 如果希望仅序列化特定字段,可以使用 `@Expose` 注解,并结合 `GsonBuilder`: ```java public class User { @Expose String name; int age; // 不会被序列化 } Gson gson = new GsonBuilder().excludeFieldsWithoutExposeAnnotation().create(); ``` - **启用 `GsonConverterFactory`(适用于 Retrofit 等框架)** 在 Android 开发中,若使用 Retrofit 进行网络请求,可以通过 `GsonConverterFactory` 简化 JSON 数据的解析过程。 #### 5. Gson 与其他 JSON 库的比较 尽管 Gson 是一个广泛使用的 JSON 库,但与 Jackson 和 FastJSON 等库相比,其性能在某些场景下可能略逊一筹。Jackson 在处理大量数据时通常更高效,而 FastJSON 则因其速度和功能丰富而受到部分开发者青睐。然而,FastJSON 曾多次曝出安全漏洞,因此在选择库时需权衡安全性与性能需求[^3]。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值