WordPress.org

Make WordPress Core

Ticket #33106: 33106.7.patch

File 33106.7.patch, 7.8 KB (added by miqrogroove, 5 years ago)
  • src/wp-includes/class-wp-embed.php

     
    318318         * @return string Potentially modified $content.
    319319         */
    320320        public function autoembed( $content ) {
    321                 // Strip newlines from all elements.
    322                 $content = wp_replace_in_html_tags( $content, array( "\n" => " " ) );
     321                // Replace line breaks from all HTML elements with placeholders.
     322                $content = wp_replace_in_html_tags( $content, array( "\n" => '<!-- wp-line-break -->' ) );
    323323
    324324                // Find URLs that are on their own line.
    325                 return preg_replace_callback( '|^(\s*)(https?://[^\s"]+)(\s*)$|im', array( $this, 'autoembed_callback' ), $content );
     325                $content = preg_replace_callback( '|^(\s*)(https?://[^\s"]+)(\s*)$|im', array( $this, 'autoembed_callback' ), $content );
     326
     327                // Put the line breaks back.
     328                return str_replace( '<!-- wp-line-break -->', "\n", $content );
    326329        }
    327330
    328331        /**
  • src/wp-includes/formatting.php

     
    504504        // Standardize newline characters to "\n".
    505505        $pee = str_replace(array("\r\n", "\r"), "\n", $pee);
    506506
    507         // Strip newlines from all elements.
    508         $pee = wp_replace_in_html_tags( $pee, array( "\n" => " " ) );
     507        // Find newlines in all elements and add placeholders.
     508        $pee = wp_replace_in_html_tags( $pee, array( "\n" => " <!-- wpnl --> " ) );
    509509
    510510        // Collapse line breaks before and after <option> elements so they don't get autop'd.
    511511        if ( strpos( $pee, '<option' ) !== false ) {
     
    592592        if ( !empty($pre_tags) )
    593593                $pee = str_replace(array_keys($pre_tags), array_values($pre_tags), $pee);
    594594
     595        // Restore newlines in all elements.
     596        $pee = str_replace( " <!-- wpnl --> ", "\n", $pee );
     597
    595598        return $pee;
    596599}
    597600
    598601/**
     602 * Separate HTML elements and comments from the text.
     603 *
     604 * @since 4.2.4
     605 *
     606 * @param string $input The text which has to be formatted.
     607 * @return array The formatted text.
     608 */
     609function wp_html_split( $input ) {
     610        static $regex;
     611
     612        if ( ! isset( $regex ) ) {
     613                $comments =
     614                          '!'           // Start of comment, after the <.
     615                        . '(?:'         // Unroll the loop: Consume everything until --> is found.
     616                        .     '-(?!->)' // Dash not followed by end of comment.
     617                        .     '[^\-]*+' // Consume non-dashes.
     618                        . ')*+'         // Loop possessively.
     619                        . '(?:-->)?';   // End of comment. If not found, match all input.
     620
     621                $cdata =
     622                          '!\[CDATA\['  // Start of comment, after the <.
     623                        . '[^\]]*+'     // Consume non-].
     624                        . '(?:'         // Unroll the loop: Consume everything until ]]> is found.
     625                        .     '](?!]>)' // One ] not followed by end of comment.
     626                        .     '[^\]]*+' // Consume non-].
     627                        . ')*+'         // Loop possessively.
     628                        . '(?:]]>)?';   // End of comment. If not found, match all input.
     629
     630                $regex =
     631                          '/('              // Capture the entire match.
     632                        .     '<'           // Find start of element.
     633                        .     '(?(?=!--)'   // Is this a comment?
     634                        .         $comments // Find end of comment.
     635                        .     '|'
     636                        .         '(?(?=!\[CDATA\[)' // Is this a comment?
     637                        .             $cdata // Find end of comment.
     638                        .         '|'
     639                        .             '[^>]*>?' // Find end of element. If not found, match all input.
     640                        .         ')'
     641                        .     ')'
     642                        . ')/s';
     643        }
     644
     645        return preg_split( $regex, $input, -1, PREG_SPLIT_DELIM_CAPTURE );
     646}
     647
     648/**
    599649 * Replace characters or phrases within HTML elements only.
    600650 *
    601651 * @since 4.2.3
     
    606656 */
    607657function wp_replace_in_html_tags( $haystack, $replace_pairs ) {
    608658        // Find all elements.
    609         $comments =
    610                   '!'           // Start of comment, after the <.
    611                 . '(?:'         // Unroll the loop: Consume everything until --> is found.
    612                 .     '-(?!->)' // Dash not followed by end of comment.
    613                 .     '[^\-]*+' // Consume non-dashes.
    614                 . ')*+'         // Loop possessively.
    615                 . '(?:-->)?';   // End of comment. If not found, match all input.
    616 
    617         $regex =
    618                   '/('              // Capture the entire match.
    619                 .     '<'           // Find start of element.
    620                 .     '(?(?=!--)'   // Is this a comment?
    621                 .         $comments // Find end of comment.
    622                 .     '|'
    623                 .         '[^>]*>?' // Find end of element. If not found, match all input.
    624                 .     ')'
    625                 . ')/s';
    626 
    627         $textarr = preg_split( $regex, $haystack, -1, PREG_SPLIT_DELIM_CAPTURE );
     659        $textarr = wp_html_split( $haystack );
    628660        $changed = false;
    629661
    630662        // Optimize when searching for one item.
  • src/wp-includes/shortcodes.php

     
    333333        $trans = array( '[' => '&#91;', ']' => '&#93;' );
    334334       
    335335        $pattern = get_shortcode_regex();
     336        $textarr = wp_html_split( $content );
    336337
    337         $comment_regex =
    338                   '!'           // Start of comment, after the <.
    339                 . '(?:'         // Unroll the loop: Consume everything until --> is found.
    340                 .     '-(?!->)' // Dash not followed by end of comment.
    341                 .     '[^\-]*+' // Consume non-dashes.
    342                 . ')*+'         // Loop possessively.
    343                 . '(?:-->)?';   // End of comment. If not found, match all input.
    344 
    345         $regex =
    346                   '/('                   // Capture the entire match.
    347                 .     '<'                // Find start of element.
    348                 .     '(?(?=!--)'        // Is this a comment?
    349                 .         $comment_regex // Find end of comment.
    350                 .     '|'
    351                 .         '[^>]*>?'      // Find end of element. If not found, match all input.
    352                 .     ')'
    353                 . ')/s';
    354 
    355         $textarr = preg_split( $regex, $content, -1, PREG_SPLIT_DELIM_CAPTURE | PREG_SPLIT_NO_EMPTY );
    356 
    357338        foreach ( $textarr as &$element ) {
    358                 if ( '<' !== $element[0] ) {
     339                if ( '' == $element || '<' !== $element[0] ) {
    359340                        continue;
    360341                }
    361342
     
    370351                        continue;
    371352                }
    372353
    373                 if ( $ignore_html || '<!--' === substr( $element, 0, 4 ) ) {
     354                if ( $ignore_html || '<!--' === substr( $element, 0, 4 ) || '<![CDATA[' === substr( $element, 0, 9 ) ) {
    374355                        // Encode all [ and ] chars.
    375356                        $element = strtr( $element, $trans );
    376357                        continue;
  • tests/phpunit/tests/formatting/Autop.php

     
    399399
    400400                $this->assertEquals( $expected, trim( wpautop( $content ) ) );
    401401        }
     402
     403        /**
     404         * Do not allow newlines within HTML elements to become mangled.
     405         *
     406         * @ticket 33106
     407         * @dataProvider data_element_sanity
     408         */
     409        function test_element_sanity( $input, $output ) {
     410                return $this->assertEquals( $output, wpautop( $input ) );
     411        }
     412
     413        function data_element_sanity() {
     414                return array(
     415                        array(
     416                                "Hello <a\nhref='world'>",
     417                                "<p>Hello <a\nhref='world'></p>\n",
     418                        ),
     419                        array(
     420                                "Hello <!-- a\nhref='world' -->",
     421                                "<p>Hello <!-- a\nhref='world' --></p>\n",
     422                        ),
     423/* Block elements inside comments will fail this test in all versions, it's not a regression.
     424                        array(
     425                                "Hello <!-- <hr> a\nhref='world' -->",
     426                                "<p>Hello <!-- <hr> a\nhref='world' --></p>\n",
     427                        ),
     428                        array(
     429                                "Hello <![CDATA[ <hr> a\nhttps://youtu.be/jgz0uSaOZbE\n ]]>",
     430                                "<p>Hello <![CDATA[ <hr> a\nhttps://youtu.be/jgz0uSaOZbE\n ]]></p>\n",
     431                        ),
     432*/
     433                        array(
     434                                "Hello <![CDATA[ a\nhttps://youtu.be/jgz0uSaOZbE\n ]]>",
     435                                "<p>Hello <![CDATA[ a\nhttps://youtu.be/jgz0uSaOZbE\n ]]></p>\n",
     436                        ),
     437                        array(
     438                                "Hello <![CDATA[ <!-- a\nhttps://youtu.be/jgz0uSaOZbE\n a\n9 ]]> -->",
     439                                "<p>Hello <![CDATA[ <!-- a\nhttps://youtu.be/jgz0uSaOZbE\n a\n9 ]]> --></p>\n",
     440                        ),
     441                        array(
     442                                "Hello <![CDATA[ <!-- a\nhttps://youtu.be/jgz0uSaOZbE\n a\n9 --> a\n9 ]]>",
     443                                "<p>Hello <![CDATA[ <!-- a\nhttps://youtu.be/jgz0uSaOZbE\n a\n9 --> a\n9 ]]></p>\n",
     444                        ),
     445                );
     446        }
     447       
    402448}