Make WordPress Core

Ticket #37718: word-count.v2.patch

File word-count.v2.patch, 8.7 KB (added by jipmoors, 10 years ago)

Added newlines before comments and converted multiple lines to multi-line comment block.

  • src/wp-admin/js/word-count.js

    diff --git src/wp-admin/js/word-count.js src/wp-admin/js/word-count.js
    index c0255fd..89afdcc 100644
     
     1/**
     2 * Word or character counting functionality. Count words or characters in a provided text string.
     3 *
     4 * @summary   Count words or characters in a text.
     5 *
     6 * @namespace wp.utils
     7 * @since     2.6
     8 */
     9
    110( function() {
     11        /**
     12         * Word counting utility
     13         *
     14         * @namespace wp.utils.wordcounter
     15         * @memberof  wp.utils
     16         *
     17         * @class
     18         *
     19         * @param {Object} settings                                   Optional. Key-value object containing overrides for
     20         *                                                            settings.
     21         * @param {RegExp} settings.HTMLRegExp                        Optional. Regular expression to find HTML elements.
     22         * @param {RegExp} settings.HTMLcommentRegExp                 Optional. Regular expression to find HTML comments.
     23         * @param {RegExp} settings.spaceRegExp                       Optional. Regular expression to find irregular space
     24         *                                                            characters.
     25         * @param {RegExp} settings.HTMLEntityRegExp                  Optional. Regular expression to find HTML entities.
     26         * @param {RegExp} settings.connectorRegExp                   Optional. Regular expression to find connectors that
     27         *                                                            split words.
     28         * @param {RegExp} settings.removeRegExp                      Optional. Regular expression to find remove unwanted
     29         *                                                            characters to reduce false-positives.
     30         * @param {RegExp} settings.astralRegExp                      Optional. Regular expression to find unwanted
     31         *                                                            characters when searching for non-words.
     32         * @param {RegExp} settings.wordsRegExp                       Optional. Regular expression to find words by spaces.
     33         * @param {RegExp} settings.characters_excluding_spacesRegExp Optional. Regular expression to find characters which
     34         *                                                            are non-spaces.
     35         * @param {RegExp} settings.characters_including_spacesRegExp Optional. Regular expression to find characters
     36         *                                                            including spaces.
     37         * @param {RegExp} settings.shortcodesRegExp                  Optional. Regular expression to find shortcodes.
     38         * @param {Object} settings.l10n                              Optional. Localization object containing specific
     39         *                                                            configuration for the current localization.
     40         * @param {String} settings.l10n.type                         Optional. Method of finding words to count.
     41         * @param {Array}  settings.l10n.shortcodes                   Optional. Array of shortcodes that should be removed
     42         *                                                            from the text.
     43         *
     44         * @return void
     45         */
    246        function WordCounter( settings ) {
    347                var key,
    448                        shortcodes;
    549
     50                // Apply provided settings to object settings.
    651                if ( settings ) {
    752                        for ( key in settings ) {
     53
     54                                // Only apply valid settings.
    855                                if ( settings.hasOwnProperty( key ) ) {
    956                                        this.settings[ key ] = settings[ key ];
    1057                                }
     
    1360
    1461                shortcodes = this.settings.l10n.shortcodes;
    1562
     63                // If there are any localization shortcodes, add this as type in the settings.
    1664                if ( shortcodes && shortcodes.length ) {
    1765                        this.settings.shortcodesRegExp = new RegExp( '\\[\\/?(?:' + shortcodes.join( '|' ) + ')[^\\]]*?\\]', 'g' );
    1866                }
    1967        }
    2068
     69        // Default settings.
    2170        WordCounter.prototype.settings = {
    2271                HTMLRegExp: /<\/?[a-z][^>]*?>/gi,
    2372                HTMLcommentRegExp: /<!--[\s\S]*?-->/g,
    2473                spaceRegExp: /&nbsp;|&#160;/gi,
    2574                HTMLEntityRegExp: /&\S+?;/g,
     75
     76                // \u2014 = em-dash
    2677                connectorRegExp: /--|\u2014/g,
     78
     79                // Characters to be removed from input text.
    2780                removeRegExp: new RegExp( [
    2881                        '[',
     82
    2983                                // Basic Latin (extract)
    3084                                '\u0021-\u0040\u005B-\u0060\u007B-\u007E',
     85
    3186                                // Latin-1 Supplement (extract)
    3287                                '\u0080-\u00BF\u00D7\u00F7',
    33                                 // General Punctuation
    34                                 // Superscripts and Subscripts
    35                                 // Currency Symbols
    36                                 // Combining Diacritical Marks for Symbols
    37                                 // Letterlike Symbols
    38                                 // Number Forms
    39                                 // Arrows
    40                                 // Mathematical Operators
    41                                 // Miscellaneous Technical
    42                                 // Control Pictures
    43                                 // Optical Character Recognition
    44                                 // Enclosed Alphanumerics
    45                                 // Box Drawing
    46                                 // Block Elements
    47                                 // Geometric Shapes
    48                                 // Miscellaneous Symbols
    49                                 // Dingbats
    50                                 // Miscellaneous Mathematical Symbols-A
    51                                 // Supplemental Arrows-A
    52                                 // Braille Patterns
    53                                 // Supplemental Arrows-B
    54                                 // Miscellaneous Mathematical Symbols-B
    55                                 // Supplemental Mathematical Operators
    56                                 // Miscellaneous Symbols and Arrows
     88
     89                                /*
     90                                 * The following range consists of:
     91                                 * General Punctuation
     92                                 * Superscripts and Subscripts
     93                                 * Currency Symbols
     94                                 * Combining Diacritical Marks for Symbols
     95                                 * Letterlike Symbols
     96                                 * Number Forms
     97                                 * Arrows
     98                                 * Mathematical Operators
     99                                 * Miscellaneous Technical
     100                                 * Control Pictures
     101                                 * Optical Character Recognition
     102                                 * Enclosed Alphanumerics
     103                                 * Box Drawing
     104                                 * Block Elements
     105                                 * Geometric Shapes
     106                                 * Miscellaneous Symbols
     107                                 * Dingbats
     108                                 * Miscellaneous Mathematical Symbols-A
     109                                 * Supplemental Arrows-A
     110                                 * Braille Patterns
     111                                 * Supplemental Arrows-B
     112                                 * Miscellaneous Mathematical Symbols-B
     113                                 * Supplemental Mathematical Operators
     114                                 * Miscellaneous Symbols and Arrows
     115                                 */
    57116                                '\u2000-\u2BFF',
     117
    58118                                // Supplemental Punctuation
    59119                                '\u2E00-\u2E7F',
    60120                        ']'
    61121                ].join( '' ), 'g' ),
     122
     123                // Remove UTF-16 surrogate points, see https://en.wikipedia.org/wiki/UTF-16#U.2BD800_to_U.2BDFFF
    62124                astralRegExp: /[\uD800-\uDBFF][\uDC00-\uDFFF]/g,
    63125                wordsRegExp: /\S\s+/g,
    64126                characters_excluding_spacesRegExp: /\S/g,
     127
     128                /*
     129                 * Match anything that is not a formatting character, excluding:
     130                 * \f = form feed
     131                 * \n = new line
     132                 * \r = carriage return
     133                 * \t = tab
     134                 * \v = vertical tab
     135                 * \u00AD = soft hyphen
     136                 * \u2028 = line separator
     137                 * \u2029 = paragraph separator
     138                 */
    65139                characters_including_spacesRegExp: /[^\f\n\r\t\v\u00AD\u2028\u2029]/g,
    66140                l10n: window.wordCountL10n || {}
    67141        };
    68142
     143        /**
     144         * Counts the number of words (or other specified type) in the specified text.
     145         *
     146         * @summary  Count the number of elements in a text.
     147         *
     148         * @since    2.6
     149         * @memberof wp.utils.wordcounter
     150         *
     151         * @param {String}  text Text to count elements in.
     152         * @param {String}  type Optional. Specify type to use.
     153         *
     154         * @return {Number} The number of items counted.
     155         */
    69156        WordCounter.prototype.count = function( text, type ) {
    70157                var count = 0;
    71158
     159                // Use default type if none was provided.
    72160                type = type || this.settings.l10n.type;
    73161
     162                // Sanitize type to one of three possibilities: 'words', 'characters_excluding_spaces' or 'characters_including_spaces'.
    74163                if ( type !== 'characters_excluding_spaces' && type !== 'characters_including_spaces' ) {
    75164                        type = 'words';
    76165                }
    77166
     167                // If we have any text at all.
    78168                if ( text ) {
    79169                        text = text + '\n';
    80170
     171                        // Replace all HTML with a new-line.
    81172                        text = text.replace( this.settings.HTMLRegExp, '\n' );
     173
     174                        // Remove all HTML comments.
    82175                        text = text.replace( this.settings.HTMLcommentRegExp, '' );
    83176
     177                        // If a shortcode regular expression has been provided use it to remove shortcodes.
    84178                        if ( this.settings.shortcodesRegExp ) {
    85179                                text = text.replace( this.settings.shortcodesRegExp, '\n' );
    86180                        }
    87181
     182                        // Normalize non-breaking space to a normal space.
    88183                        text = text.replace( this.settings.spaceRegExp, ' ' );
    89184
    90185                        if ( type === 'words' ) {
     186
     187                                // Remove HTML Entities.
    91188                                text = text.replace( this.settings.HTMLEntityRegExp, '' );
     189
     190                                // Convert connectors to spaces to count attached text as words.
    92191                                text = text.replace( this.settings.connectorRegExp, ' ' );
     192
     193                                // Remove unwanted characters.
    93194                                text = text.replace( this.settings.removeRegExp, '' );
    94195                        } else {
     196
     197                                // Convert HTML Entities to "a".
    95198                                text = text.replace( this.settings.HTMLEntityRegExp, 'a' );
     199
     200                                // Remove surrogate points.
    96201                                text = text.replace( this.settings.astralRegExp, 'a' );
    97202                        }
    98203
     204                        // Match with the selected type regular expression to count the items.
    99205                        text = text.match( this.settings[ type + 'RegExp' ] );
    100206
     207                        // If we have any matches, set the count to the number of items found.
    101208                        if ( text ) {
    102209                                count = text.length;
    103210                        }
     
    106213                return count;
    107214        };
    108215
     216        // Add the WordCounter to the WP Utils.
    109217        window.wp = window.wp || {};
    110218        window.wp.utils = window.wp.utils || {};
    111219        window.wp.utils.WordCounter = WordCounter;