hello दोस्तों, आज मैं आपको data mining के टॉपिक rule based classifiers in hindi के बारें में बताऊंगा. तो चलिए start करते है:-
- data mining क्या है?
- decision tree के बारें में पढ़िए
Rule based classifiers in hindi
IF-THEN Rules
rule-based classifier जो है वह IF-THEN rules के एक set का प्रयोग classification के लिए करता है. हम एक rule को निम्नलिखित रूप में प्रस्तुत कर सकते है:-
IF condition THEN conclusion
हम यहाँ एक rule R1 मान लेते है,
R1 : IF age = youth AND student = yes
THEN buy_laptop = yes
याद रखने वाली बातें:-
- rule के IF वाले part को rule antecedent या precondition कहते है.
- rule के THEN वाले part को rule consequent कहते है.
- antecedent part के एक या एक से ज्यादा attribute tests होते है.
- consequent part में class prediction सम्मिलित रहता है.
नोट:- हम R1 को निम्नलिखित तरीके से भी लिख सकते है:-
R1 : ((age = youth) ^ (student = yes)) (buys laptop = yes)
यदि ऊपर दी गयी condition सत्य होती है तो तब antecedent, satisfy हो जाता है.
Rule extraction
यहाँ हम सीखेंगे कि एक decision tree से IF-THEN rules को extract करके rule-based classifier कैसे बनाया जाता है.
Rule extraction using sequential covering algorithm
sequential covering algorithm का प्रयोग करके training data से IF-THEN rules को extract किया जा सकता है. हमें इसमें पहले decision tree को generate करने की आवश्यकता नही पड़ती.
इस algorithm का नाम sequential covering इसलिए पड़ा क्योंकि इस algorithm में, दिए गये class का प्रत्येक rule उस class के बहुत सारें tuples को cover करता है. और इन rules को sequentially (एक के बाद एक) learn किया जाता है.
इस algorithm का प्रयोग classification rules के sets की mining करने के लिए सबसे ज्यादा किया जाता है.
कुछ बहुत जयादा प्रयोग की जाने वाली sequential covering algorithms – AQ, CN2, तथा RIPPER है.
इसकी सामान्य strategy होती है कि इसमें एक एक समय में केवल एक rule को ही learn किया जाता है. और जो tuple, rule के द्वारा cover किया गया होता है उसे remove कर दिया जाता है और यह प्रक्रिया सभी tuples के लिए चलती है.
नीचे एक sequential covering algorithm दी गयी है जहाँ rules को एक समय में एक class के लिए learn किया जाता है. इसमें जब हम class C के लिए rule को learn करते है तो हम चाहते है कि class C के सभी training tuples, cover हो जाएँ. और अन्य class का कोई भी tuple cover ना हो. इस तरीके से हम जिन भी rules को learn करेंगे वो high accuracy के होंगे.