Python稀疏矩阵处理及四种格式对比

　　发布于2026-03-16　阅读（0）

扫一扫，手机访问

选csc_matrix还是csr_matrix取决于操作方向：列切片用csc_matrix，行切片用csr_matrix；coo_matrix仅适用于构造阶段，需转为csr/csc才能运算；lil_matrix仅适合动态构建，完成后必须转换；拼接矩阵前须统一格式并校验形状。

Python怎么处理稀疏矩阵_SciPy库稀疏矩阵四种存储格式对比

稀疏矩阵该选 `csc_matrix` 还是 `csr_matrix`？

取决于你主要做「列切片」还是「行切片」——csc_matrix（Compressed Sparse Column）对列操作快，csr_matrix（Compressed Sparse Row）对行操作快。底层是用三个数组存非零值、行索引、列指针（或反之），结构差异直接决定访问效率。

常见错误现象：mat[:, 5] 在 csr_matrix 上会触发全矩阵转置再切片，慢得离谱；反过来，mat[3, :] 在 csc_matrix 上也一样。

做特征提取、按列标准化（比如每列减均值）→ 优先用 csc_matrix
做样本采样、按行计算 L2 范数、批量预测 → 优先用 csr_matrix
从 scipy.sparse.load_npz() 加载后默认是 csr，别直接拿去列操作
转换开销不可忽略：mat.tocsc() 或 mat.tocsr() 是 O(nnz) 时间，不是常数

`coo_matrix` 为什么不能直接做乘法？

coo_matrix 是最原始的三元组格式（行索引、列索引、值），不支持算术运算和切片，因为没建索引结构——它连「某行有哪些非零元」都得遍历找。

使用场景：只适合构造阶段。比如从文件逐行读取 (i, j, val)，append 到三个列表里，最后一次性转成 coo_matrix，再立刻转成 csr 或 csc。

误用 coo_matrix 做 @ 矩阵乘 → 报错 TypeError: unsupported operand type(s) for @: 'coo_matrix' and 'coo_matrix'
coo_matrix 允许重复 (i,j)，但转成 csr/csc 时会自动求和，这是隐式行为，容易漏掉数据异常
构造完必须转：用 .tocsr() 或 .tocsc()，别留着 coo 做后续计算

`lil_matrix` 适合动态插入，但千万别用它存最终结果

lil_matrix（List of Lists）内部用 Python 列表存每行的列索引和值，支持 mat[i, j] = x 这种随机写入，但内存占用高、访问慢、不支持广播运算。

性能影响明显：10 万行 × 10 万列的稀疏矩阵，用 lil 存可能吃掉 2–3 倍内存，且 mat.sum(axis=1) 比 csr 慢一个数量级。

只在「边生成边填」场景用：比如迭代算法中逐行构造矩阵
填完立刻转：mat.tocsr() 是标准收尾动作，不是可选项
别用 lil_matrix 做 np.dot 或传给 sklearn 模型——很多模型内部会检查格式，遇到 lil 直接报 ValueError: Expected CSR or CSC matrix

用 `scipy.sparse.bmat` 拼接矩阵时维度对不上怎么办？

bmat 要求子块在逻辑上能排成矩形，比如 [[A, B], [C, D]] 中，A.shape[0] 必须等于 C.shape[0]，A.shape[1] 等于 B.shape[1]，否则报 ValueError: blocks must be 2-D 或更模糊的 inconsistent shapes。

容易踩的坑是混用不同格式：比如 A 是 csr，B 是 coo，bmat 不会自动统一，可能在拼接中途因格式不兼容崩掉。

拼之前先统一格式：A.tocsr(), B.tocsr(), C.tocsr(), D.tocsr()
手动校验形状：assert A.shape[0] == C.shape[0] 和 assert A.shape[1] == B.shape[1]，比看报错信息快得多
如果只是水平拼（[A, B]），用 scipy.sparse.hstack([A, B]) 更稳；垂直拼用 vstack，它们对形状要求更明确，报错也更直白

稀疏格式转换不是“无感”的，每次 .tocsr() 都在重排数据；而不同格式对同一操作的时间差可以到百倍。真正卡住你的往往不是算法，而是矩阵刚加载完就用错了格式。

本文转载于：互联网如有侵犯，请联系zhengruancom@outlook.com删除。
免责声明：正软商城发布此文仅为传递信息，不代表正软商城认同其观点或证实其描述。

上一篇：Java正则实现值转键的条件匹配解析

下一篇：Matplotlib 设置 colorbar 整数刻度方法

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

夸克浏览器怎么设置电脑模式?夸克浏览器设置成电脑模式教程

夸克浏览器怎么设置电脑模式？嘿，兄弟们，你是否曾经需要在手机上看网页，但又要让页面显示效果如同在电脑上的体验？如果是，那么恭喜您，夸克浏览器就是您的不二之选！它不仅拥有简洁明了的界面设计，而且夸克浏览器手机版也可以轻松设置成电脑版，让你在手机端也能够享受到如同在电脑上的浏览体验。

14小时前 12:02 0
正版软件

夸克浏览器怎么开启成人模式?夸克浏览器设置成人模式的方法

如今电子产品不仅成年人在使用，未成年也是深深着迷，而各大产品为了更好的把控未成年人的电子产品使用时间，因此很多应用都提供了未成年模式，像夸克浏览器也一样，那么夸克浏览器怎么开启成人模式呢？夸克浏览器设置成人模式的方法1、打开您的夸克浏览器应用，点击屏幕右下角的三横线菜单图标。

15小时前 11:51 0
正版软件

东方甄选如何进行企业团购?东方甄选企业团购教程

东方甄选如何进行企业团购？每次节日到来前，各位企业的小伙伴是不是还在发愁为购买公司的礼品而发愁？不妨来看看东方甄选专享的企业团购吧！东方甄选能够给企业礼物提供定制化解决方案、企业优惠、专属服务，满足多元化的需求，让企业采购简单快捷、更省心，也能让员工更放心更满意。

15小时前 11:39 0
正版软件

饿了么怎么让别人代付?饿了么让别人代付的步骤教程

饿了么怎么让别人代付？现在夏天越来越热，相信在暑假时期外卖就是大家的救命稻草，饿了么这个软件大家应该也是十分熟悉，但是很多小伙伴跟小编反馈说不知道饿了么怎么让别人代付订单，那接下来小编就来给大家解决问题，带来饿了么让别人代付的步骤，一起来往下看看吧！

昨天 03-20 13:52 0
正版软件

饿了么如何设置小额免密支付功能?饿了么设置小额免密支付教程

饿了么如何设置小额免密支付功能？随着移动支付的普及和便利性，饿了么为了进一步提升用户体验，推出了小额免密支付功能。一些小伙伴反馈第一次使用不知道怎么去开启这个免密功能，让小编出一期关于这个操作的详细教程，这不它来了！本教程将详细介绍如何设置和使用这一功能，帮助您更加便捷地享受饿了么的服务。

昨天 03-20 13:30 0