Unicode: flag "u" and class \p{...} #374

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

Sign up for GitHub

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Jump to bottom

Merged

dolgachio merged 2 commits into javascript-tutorial:master from lanachayka:regexpUnicode

Oct 12, 2022

Contributor

lanachayka commented Jul 24, 2022

No description provided.


          translate an article: Unicode: flag u and class \p{...}

c1c7a99

javascript-translate-bot added the review needed label

CLAassistant commented Jul 24, 2022 •

edited

Loading

All committers have signed the CLA.

dolgachio self-assigned this

dolgachio changed the title ~~translate an article: Unicode: flag u and class \p{...}~~ Unicode: flag "u" and class \p{...}

Collaborator

dolgachio commented Aug 4, 2022

dolgachio added the in progress label

dolgachio requested changes

View reviewed changes

Collaborator

dolgachio left a comment

Дякую, за чудовий переклад! Вибачаюсь, що так довго перевіряв.
Наступного разу все буде набагато швидше =)

Внесіть, будь ласка, зміни про які я написав. Якщо будуть питання, напишіть мені :)

9-regular-expressions/03-regexp-unicode/article.md Outdated

    
              |------------|---------|--------|

              | a | `0x0061` |  2 |

              | ≈ | `0x2248` |  2 |

              |𝒳| `0x1d4b3` | 4 |

              |𝒴| `0x1d4b4` | 4 |

              |😄| `0x1f604` | 4 |

              So characters like `a` and `≈` occupy 2 bytes, while codes for `𝒳`, `𝒴` and `😄` are longer, they have 4 bytes.

              Таким чином, такі символи, як `a` і `≈`, займають 2 байти, а коди для `𝒳`, `𝒴` і `😄` довші, в них - 4 байти.

Collaborator

dolgachio Oct 12, 2022

Suggested change

      
            Таким чином, такі символи, як `a` і `≈`, займають 2 байти, а коди для `𝒳`, `𝒴` і `😄` довші, в них - 4 байти.
          
            Таким чином, такі символи, як `a` і `≈`, займають 2 байти, а коди для `𝒳`, `𝒴` і `😄` довші, в них -- 4 байти.

9-regular-expressions/03-regexp-unicode/article.md Outdated

    
              Long time ago, when JavaScript language was created, Unicode encoding was simpler: there were no 4-byte characters. So, some language features still handle them incorrectly.

              Коли створювалась мова JavaScript, кодування Юнікод було простіше: 4-байтвоих символів не існувало. Тому досі деякі функції мови все ще обробляють їх неправильно.

Collaborator

dolgachio Oct 12, 2022

Suggested change

      
            Коли створювалась мова JavaScript, кодування Юнікод було простіше: 4-байтвоих символів не існувало. Тому досі деякі функції мови все ще обробляють їх неправильно.
          
            Коли створювалась мова JavaScript, кодування Юнікод було простіше: 4-байтових символів не існувало. Тому досі деякі функції мови все ще обробляють їх неправильно.

9-regular-expressions/03-regexp-unicode/article.md

               ```js run
               alert('😄'.length); // 2
               alert('𝒳'.length); // 2
               ```
+              ...Але ми бачимо, що лише один, правда ж? Річ у тому, що властивість `length` трактує 4 байти, як два символи по 2 байти. Це не правильно, адже їх необхідно розглядати тільки разом (так звана "сурогатна пара", детальніше у розділі <info:string>).

Collaborator

dolgachio Oct 12, 2022

Перенесіть, будь ласка, цей текст на наступний рядок. У перекладі має бути стільки ж рядків, як і в оригінальній статті. Це необхідно щоб у майбутньому синхронізувати зміни.

9-regular-expressions/03-regexp-unicode/article.md Outdated

    
              ...But we can see that there's only one, right? The point is that `length` treats 4 bytes as two 2-byte characters. That's incorrect, because they must be considered only together (so-called "surrogate pair", you can read about them in the article <info:string>).

              За замовчуванням регулярні вирази також розглядають 4-байтові «довгі символи» як пару 2-байтових. Як і у випадку з рядками, це може призвести до дивних результатів. Ми побачимо це трохи пізніше, у розділі <info:regexp-character-sets-and-ranges>.

Collaborator

dolgachio Oct 12, 2022

Suggested change

      
            За замовчуванням регулярні вирази також розглядають 4-байтові «довгі символи» як пару 2-байтових. Як і у випадку з рядками, це може призвести до дивних результатів. Ми побачимо це трохи пізніше, у розділі <info:regexp-character-sets-and-ranges>.
          
            За замовчуванням регулярні вирази також розглядають 4-байтові "довгі символи" як пару 2-байтових. Як і у випадку з рядками, це може призвести до дивних результатів. Ми побачимо це трохи пізніше, у розділі <info:regexp-character-sets-and-ranges>.

9-regular-expressions/03-regexp-unicode/article.md Outdated


		## Unicode properties \p{...}
		Кожен символ в кодуванні Юнікод має багато властивостей. Вони описують, до якої «категорії» належить символ та містять різну інформацію про нього.

Collaborator

dolgachio Oct 12, 2022

Suggested change

      
            Кожен символ в кодуванні Юнікод має багато властивостей. Вони описують, до якої «категорії» належить символ та містять різну інформацію про нього.
          
            Кожен символ в кодуванні Юнікод має багато властивостей. Вони описують, до якої "категорії" належить символ та містять різну інформацію про нього.

9-regular-expressions/03-regexp-unicode/article.md Outdated

+              - `Hex_Digit` містить шістнадцяткові числа: `0-9`, `a-f`.
+              - ...І так далі.
+              Юнікод підтримує велику кількість властивостей, і їхній повний перелік потребував би дуже багато місця, тому ось посилання.

Collaborator

dolgachio Oct 12, 2022

Suggested change

      
            Юнікод підтримує велику кількість властивостей, і їхній повний перелік потребував би дуже багато місця, тому ось посилання.
          
            Юнікод підтримує велику кількість властивостей, і їхній повний перелік вимагав би дуже багато місця, тому ось посилання:

9-regular-expressions/03-regexp-unicode/article.md Outdated

    
              There's a Unicode property `Script` (a writing system), that may have a value: `Cyrillic`, `Greek`, `Arabic`, `Han` (Chinese) and so on, [here's the full list](https://en.wikipedia.org/wiki/Script_(Unicode)).

              Нам допоможе властивість Юнікоду - `Script` (система письма), яка може мати значення: `Cyrillic`(Кирилиця), `Greek` (Грецька), `Arabic` (Арабська), `Han` (Китайська) та інші, [тут повний перелік](https://en.wikipedia.org/wiki/Script_(Unicode)).

Collaborator

dolgachio Oct 12, 2022

Suggested change

      
            Нам допоможе властивість Юнікоду - `Script` (система письма), яка може мати значення: `Cyrillic`(Кирилиця), `Greek` (Грецька), `Arabic` (Арабська), `Han` (Китайська) та інші, [тут повний перелік](https://en.wikipedia.org/wiki/Script_(Unicode)).
          
            Нам допоможе властивість Юнікоду -- `Script` (система письма), яка може мати значення: `Cyrillic`(Кирилиця), `Greek` (Грецька), `Arabic` (Арабська), `Han` (Китайська) та інші, [тут повний перелік](https://en.wikipedia.org/wiki/Script_(Unicode)).

9-regular-expressions/03-regexp-unicode/article.md

+                - не призначенні `Cn`,
+                - для приватного користування `Co`,
+                - сурогат `Cs`.

Collaborator

dolgachio Oct 12, 2022

Додайте тут, будь ласка, пустий рядок як було в оригінальній статті. Це потрібно знову ж таки для сумісності з англійським варіантом.

javascript-translate-bot added changes requested and removed review needed labels

Contributor

javascript-translate-bot commented Oct 12, 2022

Please make the requested changes. After it, add a comment "/done".
Then I'll ask for a new review 👻


          update text after review

6f66886

Contributor Author

lanachayka commented Oct 12, 2022

/done

javascript-translate-bot added review needed and removed changes requested labels

Collaborator

dolgachio commented Oct 12, 2022

@all-contributors please add @lanachayka for translate

Contributor

allcontributors bot commented Oct 12, 2022

@stas-dolgachov

I couldn't determine any contributions to add, did you specify any contributions?
Please make sure to use valid contribution names.

Collaborator

dolgachio commented Oct 12, 2022

https://github.com/all-contributors please add @lanachayka for translate

Collaborator

dolgachio commented Oct 12, 2022

https://github.com/all-contributors please add @lanachayka for translation

Collaborator

dolgachio commented Oct 12, 2022

@all-contributors please add @lanachayka for translation

allcontributors bot mentioned this pull request

docs: add lanachayka as a contributor for translation #394

Merged

Contributor

allcontributors bot commented Oct 12, 2022

@stas-dolgachov

I've put up a pull request to add @lanachayka! 🎉

dolgachio approved these changes

View reviewed changes

javascript-translate-bot added needs +1 and removed review needed labels

dolgachio merged commit b9ee395 into javascript-tutorial:master

javascript-translate-bot mentioned this pull request

Ukrainian Translation Progress #1

Open

Contributor

javascript-translate-bot commented Oct 12, 2022

Thank you 💖 I updated the Progress Issue #1 🎉 🎉 🎉

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

in progress needs +1