नियमित अभिव्यक्तियों के लिए एक शुरुआती ट्यूटोरियल
रेगुलर एक्सप्रेशन, जिन्हें अक्सर रेगेक्स या रेगेक्सप के रूप में संक्षिप्त किया जाता है, वर्णों के अनुक्रम होते हैं जो एक खोज पैटर्न को परिभाषित करते हैं। इनका उपयोग आम तौर पर स्ट्रिंग मिलान, सबस्ट्रिंग को बदलने और टेक्स्ट से जानकारी निकालने के लिए किया जाता है।
नियमित अभिव्यक्तियाँ क्यों सीखें?
रेगुलर एक्सप्रेशन सीखना टेक्स्ट डेटा को संभालने की आपकी क्षमता को बहुत बढ़ा सकता है। रेगेक्स के साथ, आप यह कर सकते हैं:
- पाठ के भीतर विशिष्ट पैटर्न खोजें।
- ईमेल पते और फ़ोन नंबर जैसे इनपुट डेटा को मान्य करें.
- किसी पाठ के विशिष्ट भागों, जैसे दिनांक और URL को निकालें.
- पैटर्न के आधार पर पाठ के भीतर सबस्ट्रिंग को प्रतिस्थापित करें।
नियमित अभिव्यक्ति के मूल घटक
रेगेक्स शाब्दिक वर्णों और मेटाकैरेक्टर से बना होता है। यहाँ कुछ बुनियादी घटक दिए गए हैं:
- शाब्दिक वर्ण: वर्ण जो स्वयं से मेल खाते हैं। उदाहरण के लिए,
a
"a" से मेल खाता है। - मेटाकैरेक्टर: विशिष्ट अर्थ वाले विशेष वर्ण, जैसे
.
,*
,+
, और?
.
सामान्य मेटाकैरेक्टर और उनके अर्थ
मेटाकैरेक्टर्स को समझना रेगेक्स में महारत हासिल करने की कुंजी है। यहाँ कुछ सबसे ज़्यादा इस्तेमाल किए जाने वाले मेटाकैरेक्टर्स दिए गए हैं:
.
- नई लाइन को छोड़कर किसी भी एकल वर्ण से मेल खाता है।*
- पूर्ववर्ती तत्व की 0 या अधिक पुनरावृत्तियों से मेल खाता है।+
- पूर्ववर्ती तत्व की 1 या अधिक पुनरावृत्तियों से मेल खाता है।?
- पूर्ववर्ती तत्व की 0 या 1 पुनरावृत्ति से मेल खाता है।[]
- कोष्ठक के अंदर के किसी भी एक वर्ण से मेल खाता है.{}
- पूर्ववर्ती तत्व की उपस्थिति की एक विशिष्ट संख्या निर्दिष्ट करता है।()
- एकाधिक टोकनों को एक साथ समूहित करता है और कैप्चर समूह बनाता है।|
- OR ऑपरेटर के रूप में कार्य करता है.
उदाहरणों के साथ बुनियादी रेगेक्स पैटर्न
आइए कुछ बुनियादी रेगेक्स पैटर्न और उनकी कार्यविधि पर नजर डालें:
cat
सटीक स्ट्रिंग "cat" से मेल खाता है.
.at
किसी भी स्ट्रिंग से मेल खाता है जिसमें एकल वर्ण के बाद "at" हो, जैसे "cat", "bat", "hat".
\d{3}
ठीक तीन अंकों से मेल खाता है, जैसे "123", "456", "789".
[a-z]
"a" से "z" तक किसी भी लोअरकेस अक्षर से मेल खाता है।
(dog|cat)
"dog" या "cat" से मेल खाता है.
प्रोग्रामिंग भाषाओं में रेगेक्स का उपयोग
रेगुलर एक्सप्रेशन को विभिन्न प्रोग्रामिंग भाषाओं में व्यापक रूप से समर्थन प्राप्त है। यहाँ पायथन और जावास्क्रिप्ट में रेगेक्स के उपयोग के उदाहरण दिए गए हैं:
पायथन उदाहरण
import re
# Search for 'dog' in a string
pattern = r'dog'
text = 'The dog barked loudly.'
match = re.search(pattern, text)
if match:
print('Match found:', match.group())
else:
print('No match found')
जावास्क्रिप्ट उदाहरण
// Search for 'dog' in a string
const pattern = /dog/;
const text = 'The dog barked loudly.';
const match = text.match(pattern);
if (match) {
console.log('Match found:', match[0]);
} else {
console.log('No match found');
}
निष्कर्ष
नियमित अभिव्यक्तियाँ टेक्स्ट प्रोसेसिंग से निपटने वाले किसी भी व्यक्ति के लिए एक शक्तिशाली उपकरण हैं। बुनियादी घटकों और पैटर्न को समझने और अभ्यास करने से, आप अपने प्रोग्रामिंग प्रोजेक्ट में टेक्स्ट को संभालने और उसमें हेरफेर करने की अपनी क्षमता में काफी सुधार कर सकते हैं। विभिन्न पैटर्न के साथ प्रयोग करें और रेगेक्स की पूरी क्षमता को अनलॉक करने के लिए अपने ज्ञान को गहरा करें।