Source for file Standard.php
Documentation is available at Standard.php
* ----------------------------------------------------------------------
* Copyright (c) 2006-2016 Khaled Al-Sham'aa.
* ----------------------------------------------------------------------
* This program is open source product; you can redistribute it and/or
* modify it under the terms of the GNU Lesser General Public License (LGPL)
* as published by the Free Software Foundation; either version 3
* of the License, or (at your option) any later version.
* This program is distributed in the hope that it will be useful,
* but WITHOUT ANY WARRANTY; without even the implied warranty of
* MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
* GNU Lesser General Public License for more details.
* You should have received a copy of the GNU Lesser General Public License
* along with this program. If not, see <http://www.gnu.org/licenses/lgpl.txt>.
* ----------------------------------------------------------------------
* Class Name: Arabic Text ArStandard Class
* Original Author(s): Khaled Al-Sham'aa <khaled@ar-php.org>
* Purpose: Standardize Arabic text
* ----------------------------------------------------------------------
* Arabic Text Standardize Class
* PHP class to standardize Arabic text just like rules followed in magazines
* and newspapers like spaces before and after punctuations, brackets and
* include('./I18N/Arabic.php');
* $obj = new I18N_Arabic('Standard');
* $str = $obj->standard($content);
* @author Khaled Al-Sham'aa <khaled@ar-php.org>
* @copyright 2006-2016 Khaled Al-Sham'aa
* @license LGPL <http://www.gnu.org/licenses/lgpl.txt>
* @link http://www.ar-php.org
* This PHP class standardize Arabic text
* @author Khaled Al-Sham'aa <khaled@ar-php.org>
* @copyright 2006-2016 Khaled Al-Sham'aa
* @license LGPL <http://www.gnu.org/licenses/lgpl.txt>
* @link http://www.ar-php.org
* Loads initialize values
public function __construct()
* This method will standardize Arabic text to follow writing standards
* (just like magazine rules)
* @param string $text Arabic text you would like to standardize
* @return String Standardized version of input Arabic text
* @author Khaled Al-Sham'aa <khaled@ar-php.org>
array_push($patterns, '/\r\n/u', '/([^\@])\n([^\@])/u', '/\r/u');
array_push($replacements, "\n@@@\n", "\\1\n&&&\n\\2", "\n###\n");
* النقطة، الفاصلة، الفاصلة المنقوطة،
* النقطتان، علامتي الاستفهام والتعجب،
* النقاط الثلاث المتتالية
* يترك فراغ واحد بعدها جميعا
array_push($patterns, '/\s*([\.\،\؛\:\!\؟])\s*/u');
* النقاط المتتالية عددها 3 فقط
* (ليست نقطتان وليست أربع أو أكثر)
* الأقواس ( ) [ ] { } يترك قبلها وبعدها فراغ
* وحيد، فيما لا يوجد بينها وبين ما بداخلها
* وحيد، فيما لا يوجد بينها
* وبين ما بداخلها أي فراغ
array_push($patterns, '/\s*\"\s*(.+)((?<!\s)\"|\s+\")\s*/u');
* وحيد، فيما لا يوجد بينها
* وبين ما بداخلها أي فراغ
array_push($patterns, '/\s*\-\s*(.+)((?<!\s)\-|\s+\-)\s*/u');
* لا يترك فراغ بين حرف العطف الواو وبين
* إلا إن كانت تبدأ بحرف الواو
* الواحدات الإنجليزية توضع
* على يمين الرقم مع ترك فراغ
array_push($replacements, ' <span dir="ltr">\\2 \\1</span> ');
array_push($replacements, ' <span dir="ltr">\\1 \\2</span> ');
* النسبة المؤية دائما إلى يسار الرقم
* وبدون أي فراغ يفصل بينهما 40% مثلا
array_push($patterns, '/\n?@@@\n?/u', '/\n?&&&\n?/u', '/\n?###\n?/u');
|