如何在 PHP 中按句号将文本精准分割为两部分

　　发布于2026-04-30　阅读（0）

扫一扫，手机访问

如何在 PHP 中按句号将文本精准分割为两部分

本文介绍一种可靠方法，使用 PHP 将长文本按最后一个完整句号（.）为界，精确切分为前后两段，确保第一部分以句号结尾，第二部分为剩余内容。

处理长文本时，你是否遇到过这样的需求：需要把一段内容“智能”地切成两半，并且要求前半部分必须恰好在一个完整的句子后结束？无论是为了生成内容摘要、进行分页预处理，还是截断邮件正文，这个需求都挺常见。核心目标很明确：第一部分必须以句号（.）结尾，避免生硬地切断单词或停在标点前，从而保证语义的完整性。

听起来简单，但直接用 `explode(‘.’, $text)` 可不行。那样会把所有句号都当成分隔符，结果就是得到一堆文本碎片。更麻烦的是，它无法分辨一个句号究竟是句子的结束（如 `It is.`），还是缩写的一部分（如 `e.g.` 或 `Dr.`），更别提精准定位“最后一个完整句子的结尾”了。

✅ 推荐方案：基于 strrpos() 的精确定位与分割

那么，如何实现既精准又可靠的拆分呢？关键在于使用 `strrpos()` 函数来定位最后一个句号，再配合 `substr()` 进行切割。下面是一个经过实战检验的代码示例：

$text = 'Lorem Ipsum is simply dummy text of the printing and typesetting industry. Lorem Ipsum has been the industry\'s standard dummy text ever since the 1500s, when an unknown printer took a galley of type and scrambled it to make a type specimen book. It has survived not only five centuries, but also the leap into electronic typesetting, remaining essentially unchanged. It was popularised in the 1960s with the release of Letraset sheets containing Lorem Ipsum passages, and more recently with desktop publishing software like Aldus PageMaker including versions of Lorem Ipsum.';

// 查找最后一个句号的位置（注意：需确保其后紧跟空格或字符串结尾，提升语义准确性）
$lastDotPos = strrpos($text, '.');
if ($lastDotPos !== false) {
    // 确保该句号是句子结束：后面是空格、换行或字符串末尾
    $nextChar = $text[$lastDotPos + 1] ?? '';
    if (ctype_space($nextChar) || $nextChar === '' || $nextChar === "\n" || $nextChar === "\r") {
        $part1 = substr($text, 0, $lastDotPos + 1); // 包含句号
        $part2 = substr($text, $lastDotPos + 2);     // 跳过句号及后续空白
    } else {
        // 若最后一个句号不满足句子结束条件，可向前搜索更安全的句号（可选增强逻辑）
        $part1 = rtrim(substr($text, 0, $lastDotPos), " \t\n\r") . '.';
        $part2 = ltrim(substr($text, $lastDotPos + 1));
    }
} else {
    // 无句号时，按需处理：全归 part1 或抛出异常
    $part1 = $text;
    $part2 = '';
}
echo "Part 1:\n" . $part1 . "\n\nPart 2:\n" . $part2;

关键说明与注意事项

这套方案之所以可靠，在于它兼顾了效率与准确性。以下是几个需要留意的要点：

效率优先：`strrpos()` 的时间复杂度是 O(n)，直接从字符串末尾反向搜索，效率很高，避免了正则表达式可能带来的性能开销。
语义校验：严格检查句号后的字符（是否为空格、换行或字符串结尾），这一步至关重要。它能有效规避 `e.g.`、`Dr.` 这类缩写中的点被误判为句子结束，大幅提升了代码的鲁棒性。
扩展性考量：如果业务场景需要支持更多句子终止符（比如感叹号 `!` 或问号 `?`），可以扩展为多字符匹配。例如，使用 `preg_match(‘/[.!?]\s+$/u’, $text, $matches, PREG_OFFSET_CAPTURE)` 来定位最末的句末标点。
边界安全：务必校验 `strrpos()` 的返回值是否为 `false`。这是为了防止在空文本或根本不存在句号的文本中调用 `substr()` 而导致错误。
语言兼容性：本例主要针对英文文本。在中文混排场景中，中文句号 `。` 需要单独处理。实际项目中，若涉及多语言，务必考虑 Unicode 标点的兼容性问题。

总的来说，这个方法思路清晰、可控性强且性能优良，能够满足绝大多数服务端文本预处理的需求。它提供了一种在“精准分割”与“代码简洁”之间取得平衡的实用路径。

立即学习“PHP免费学习笔记（深入）”；

本文转载于：https://www.php.cn/faq/2393305.html 如有侵犯，请联系zhengruancom@outlook.com删除。
免责声明：正软商城发布此文仅为传递信息，不代表正软商城认同其观点或证实其描述。

上一篇：如何安全关闭多个 goroutine 共用的 Go 通道

下一篇：如何在 Go 中高效比较 time.Duration 类型并获取最小值

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

Atom如何显示缩进线？Atom缩进参考线显示设置方法

Atom需手动开启Show Indent Guide才能显示缩进参考线想让Atom编辑器里出现那些帮你对齐代码的垂直虚线吗？这事儿得手动设置一下。路径很明确：进入设置→Editor页面→找到并勾选“Show Indent Guide”这个选项。但先别急，光打开这个开关，可能还达不到“所见即所得”的

4分钟前 0
正版软件

VSCode实现分屏开发：多窗口布局与编辑器组快速切换技巧

VSCode实现分屏开发：多窗口布局与编辑器组快速切换技巧很多开发者以为，VSCode的分屏就是多开几个标签页那么简单。其实不然，它的底层逻辑完全建立在“编辑器组”这个概念之上。如果没搞懂这一点，你会发现很多操作都像在碰运气——比如按了Ctrl+\没反应，或者拖拽文件时它突然“消失”，甚至关掉一个

4分钟前 0
正版软件

Notepad++怎么手动指定某个文件的语法高亮类型

Notepad++ 语法高亮手动指定指南你是否遇到过这样的场景：在 Notepad++ 里打开一个脚本文件，代码却是一片毫无生气的黑白？别急，这通常不是软件故障，而是编辑器在等你告诉它：“嘿，请用某种特定的语法规则来渲染这份代码。” 毕竟，Notepad++ 本身并不具备自动识别文件类型的能力。

5分钟前 0
正版软件

VSCode怎么配置AutoHotkey(AHK)脚本代码的运行和单步调试环境

VSCode怎么配置AutoHotkey(AHK)脚本代码的运行和单步调试环境想在VS Code里顺畅地调试AutoHotkey v2脚本？这事儿说简单也简单，但有几个关键配置要是没对上，调试器要么罢工，要么断点形同虚设。下面就把几个核心环节和常见坑点捋清楚。确认 AutoHotkey v2 运

5分钟前 0
正版软件

Composer怎么用platform模拟环境_虚拟包设置教程【详解】

Composer的config.platform：唯一靠谱的PHP环境模拟方案开门见山，先说核心结论：在项目层面可控地模拟PHP运行环境，config.platform是当前唯一靠谱的途径。它的本质并非改变本地环境，而是“欺骗”Composer的依赖解析器，让它按照你指定的目标环境来计算和安装包。

5分钟前 0