Regular Expressions در NLP
عبارات منظم در NLP (بخش چهارم)
در ادامه مباحث پردازش زبان طبیعی در این بخش الگوهای عبارات منظم پیشرفتهتری ارائه خواهد شد.
Regular Expressions در NLP (بخش پنجم)
مشاهده ی تمام آموزش های NLP
در ادامه مباحث پردازش زبان طبیعی در این بخش الگوهای عبارات منظم پیشرفتهتری ارائه خواهد شد.
مثال: در این مثال عبارات منظم cat یا dog را میپذیرد:
تصویر 1-1. استفاده از عملگر or در عبارات منظم
تصویر 1-2 نتیجه اجرای کد
در این تصویر مشاهده میشود که با استفاده از عملگر or میتوان دو ورودی مختلف را در عبارات منظم بهعنوان الگو در نظر گرفت.
1- کاراکترها و الگوهای خاص در عبارات منظم
. (نقطه) همه کاراکترها را قبول میکند.
تصویر 2-1 نقطه در عبارات منظم
تصویر 2-2 نتیجه اجرای کد
[...] همه کاراکترهایی که در براکت هستند تشخیص داده میشود.
تصویر 3-1 استفاده از [] در عبارات منظم
تصویر 3-2 نتیجه اجرای کد
هر کاراکتری که بعد از علامت ^ نباشد.[^...]
تصویر 4-1 استفاده از ^ در عبارات منظم
تصویر 4-2 نتیجه اجرای کد
ˆ شروع هر رشتهای را برمیگرداند.
تصویر 5. استفاده از ^ در عبارات منظم و نتیجه کد
در این کد مشخص میشود که رشته با t شروع میشود. اگر مثلاً t را به y تغییر دهیم نتیجه متفاوت خواهد بود:
تصویر 6. استفاده از ^ در عبارات منظم و نتیجه کد
$ انتهای هر رشته را برمیگرداند.
مشابه مثال قبل میتوان کاراکتر انتهای رشته را مشخص کرد.
{m,n} m تا n بار وقوع یک الگو را برمیگرداند.
در این بخش میتوان با این مثال آغاز کرد که اعداد چندرقمی را در متن تشخیص دهیم.
تصویر 7. تشخیص تمام اعداد دورقمی در عبارات منظم
\d همه اعداد را برمیگرداند. معادل [0-9]
\D همه کاراکترها بهجز اعداد را برمیگرداند معادل [^0-9]
\s همه فاصلهها، تبها و خط بعد (newline) را تشخیص میدهد.
\S همه کاراکترها جز فاصله را برمیگرداند.
\w هر کاراکتری که عدد یا حرف باشد برمیگرداند. معادل [a-zA-Z0-9 ]
\W هر کاراکتری غیر از عدد یا حروف را برمیگرداند.
در بخشهای بعدی الگوهای پیشرفتهتری از عبارات منظم را ارائه خواهیم کرد.
"تهیه شده در سایت ABLY"