如何高效将 JSON 数据批量导入 Django 模型（SQL 数据库）

　　发布于2026-05-02　阅读（0）

扫一扫，手机访问

如何高效将 JSON 数据批量导入 Django 模型（SQL 数据库）

本文详解 Django 中将 JSON 文件数据批量写入数据库的正确方法，重点解决单次循环中仅保存最后一条记录的问题，并推荐使用 bulk_create() 实现高性能、低开销的一次性批量插入。

在 Django 开发中，从外部 JSON 文件导入数据到数据库，是个高频操作。但不少新手容易踩一个坑：在循环里创建了模型实例，却把保存操作放错了位置，结果数据库里只孤零零躺着最后一条记录，前面的数据全丢了。

比如下面这段典型的“问题代码”：

for item in data:
    my_model_instance = MyModel(...)  # 每次覆盖引用
my_model_instance.sa ve()  # ❌ 只保存最后一次迭代的对象

问题出在哪？关键在于，.sa ve() 必须放在循环内部，每创建一个实例就立刻保存。但更优的方案是：先把所有实例“攒”起来，然后一次性入库。这正是 Django ORM 的 bulk_create() 方法大显身手的地方。

这个方法会把成百上千条记录，打包成一条或极少数几条 SQL INSERT 语句发送给数据库。比起在循环里调用 N 次 .sa ve()（意味着 N 次数据库连接和事务），性能提升可不是一星半点，尤其是在处理大量数据时，效率差异能达到数十倍。

那么，具体该怎么写呢？下面是一个优化后的、可直接使用的视图函数示例：

from django.shortcuts import render
import json
from .models import MyModel
import os

def display(request):
    # 构建 JSON 文件绝对路径（注意：建议使用 settings.BASE_DIR 更健壮）
    json_file_path = os.path.join(
        os.path.dirname(__file__), '..', '..', 'jsondata.json'
    )

    try:
        with open(json_file_path, 'r', encoding='utf-8') as f:
            data = json.load(f)

        # ✅ 使用列表推导式批量构建模型实例
        model_instances = [
            MyModel(
                end_year=item.get('end_year'),
                intensity=item.get('intensity'),
                sector=item.get('sector'),
                topic=item.get('topic'),
                insight=item.get('insight'),
                url=item.get('url'),
                region=item.get('region'),
                start_year=item.get('start_year'),
                impact=item.get('impact'),
                added=item.get('added'),
                published=item.get('published'),
                country=item.get('country'),
                relevance=item.get('relevance'),
                pestle=item.get('pestle'),
                source=item.get('source'),
                title=item.get('title'),
                likelihood=item.get('likelihood'),
            )
            for item in data
        ]

        # ✅ 批量写入数据库（自动跳过空列表，支持 batch_size 参数分批）
        MyModel.objects.bulk_create(model_instances, batch_size=1000)

    except FileNotFoundError:
        data = []
        # 可选：记录日志或抛出自定义异常
        # import logging; logging.error("JSON file not found: %s", json_file_path)
    except json.JSONDecodeError as e:
        data = []
        # 处理 JSON 格式错误
        raise ValueError(f"Invalid JSON format: {e}") from e
    except Exception as e:
        # 建议捕获更具体的异常（如 IntegrityError），便于调试
        raise

    return render(request, 'display.html', {'data': data})

代码写好了，但魔鬼藏在细节里。想让这段代码足够健壮，能上生产环境，有几个关键点必须注意：

✅ 使用 .get(key) 替代直接 item[‘key’]：这能有效避免因为 JSON 里某个字段意外缺失而导致的 KeyError 崩溃，让程序更从容。
✅ 指定 encoding=‘utf-8’：处理包含中文或其他非 ASCII 字符的数据时，这行代码能救命，确保不会出现乱码。
✅ 善用 batch_size 参数：当数据量极大（比如超过一万条）时，设置 batch_size=1000 可以分批插入，既能避免单条 SQL 语句过长导致数据库报错，也能防止内存被瞬间吃光。
⚠️ bulk_create() 不触发 sa ve() 方法和信号：这是个重要的限制。如果你在模型的 sa ve() 方法里写了自定义逻辑，或者依赖 pre_sa ve/post_sa ve 信号来做点事情（比如自动更新某个时间戳），那么 bulk_create() 会绕过它们。这种情况下，就需要考虑其他方案，比如使用 model_to_dict() 配合表单保存，或者手动在批量创建后触发相关逻辑。
⚠️ 留意主键与默认值：对于自增主键（AutoField），bulk_create() 会自动处理好。但是，对于模型中字段定义的 default 值（例如 default=timezone.now），bulk_create() 不会自动计算并填充。你需要在创建实例时，就显式地传入这些值。
✅ 路径安全是底线：示例中使用了相对路径来定位 JSON 文件，这在开发中或许方便，但在生产环境是隐患。最佳实践是，通过 settings.BASE_DIR 来构建绝对路径，将数据文件放在项目结构内明确的位置进行管理。

把这些要点都做到位，你的 JSON 数据导入流程就不仅仅是“能用”，而是具备了生产环境所需的健壮性、可维护性与高性能。从源头避免数据丢失，让批量操作真正快起来，这才是高效开发该有的样子。

如何高效将 JSON 数据批量导入 Django 模型（SQL 数据库）

本文转载于：https://www.php.cn/faq/2340951.html 如有侵犯，请联系zhengruancom@outlook.com删除。
免责声明：正软商城发布此文仅为传递信息，不代表正软商城认同其观点或证实其描述。

上一篇：PHP怎么处理GraphQL Federation_PHP微服务图聚合【介绍】

下一篇：Python做人脸识别为什么对光照敏感_增加直方图均衡化预处理与多角度数据增强

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

PHP配置文件中upload_max_filesize怎么设置

在PHP中调整文件上传大小限制：一步步详解处理大文件上传时，PHP默认的配置往往不够用。别担心，核心的调整开关就在upload_max_filesize这个参数上。下面就来拆解一下，如何精准地找到并修改它。第一步：定位你的php.ini文件这事儿的关键在于找到正确的配置文件。php.ini的位

15分钟前 0
正版软件

如何调整PHP执行时间限制

调整PHP执行时间限制的几种方法在处理耗时较长的任务时，PHP脚本可能会因为默认的执行时间限制而意外终止。别担心，这个问题有几种成熟的解决方案。下面就来详细说说如何根据不同的场景和权限，灵活地调整这个限制。 1. 修改php.ini文件（全局生效）最根本的方法是从源头入手，直接修改PHP的配置文

15分钟前 0
正版软件

Linux下PHP内存限制怎么设置

在Linux系统中调整PHP内存限制当PHP应用需要处理更复杂的任务时，默认的内存配额可能就显得捉襟见肘了。别担心，通过修改一个核心配置文件，就能轻松解决这个问题。整个过程清晰直接，我们一步步来看。第一步：定位配置文件关键文件是 php.ini。它的位置取决于PHP的运行方式：如果PHP是通

16分钟前 0
正版软件

如何在Linux上配置Python数据库连接

在Linux上配置Python数据库连接在Linux环境下为Python配置数据库连接，是许多开发项目绕不开的基础环节。这个过程其实并不复杂，关键在于理清步骤，按部就班。通常，它会涉及以下几个核心环节。 1. 安装数据库第一步，自然是在你的Linux系统上安装目标数据库。不同的数据库，安装命令也

16分钟前 0
正版软件

Linux Python如何进行安全配置

Linux Python 安全配置清单在Linux环境下部署Python应用，安全是地基，不容忽视。这份清单旨在提供一套从环境到代码、从网络到进程的纵深防御思路，帮你把安全配置做得更扎实。一运行环境与权限最小化使用虚拟环境隔离依赖：首推Python内置的venv模块。它能有效隔离项目依赖，避

16分钟前 0

如何高效将 JSON 数据批量导入 Django 模型（SQL 数据库）

如何高效将 JSON 数据批量导入 Django 模型（SQL 数据库）

产品推荐

最新发布

相关推荐

热门关注