मुख्य कंटेंट तक स्किप करें

Table.AddFuzzyClusterColumn

तालिका में निर्दिष्ट स्तंभ के फ़ज़ी समूहीकरण मानों द्वारा प्राप्त किए गए प्रतिनिधि मानों वाला एक नया स्तंभ जोड़ता है.

Syntax

Table.AddFuzzyClusterColumn(
table as table,
columnName as text,
newColumnName as text,
optional options as record
) as table

Remarks

columnName के प्रतिनिधि मानों वाले table में एक नया स्तंभ newColumnName जोड़ता है. प्रत्येक पंक्ति के लिए, columnName में फज़ी तौर पर मिलान मानों द्वारा प्रतिनिधियों को प्राप्त किया जाता है. कुंजी स्तंभ की तुलना करने के तरीके को निर्दिष्ट करने के लिए options का एक वैकल्पिक सेट शामिल किया जा सकता है. विकल्पों में शामिल हैं:

  • Culture : निर्दिष्ट कल्चर नियमों के आधार पर समूहीकरण वाले रिकॉर्ड्स को अनुमति देता है. यह कोई मान्य कल्चर नाम हो सकता है. उदाहरण के लिए, "ja-JP" का कल्चर विकल्प, जापानी संस्कृति पर आधारित रिकॉर्ड को समूहीकृत करता है. डिफ़ॉल्ट मान "" है, जो अपरिवर्तनीय अंग्रेज़ी कल्चर पर आधारित है.
  • IgnoreCase : एक तार्किक (सही/गलत) मान, जो केस-असंवेदी कुंजी समूहीकरण की अनुमति देता है. उदाहरण के लिए, जब सही होता है, तो "Grapes" को "grapes" के साथ समूहीकृत किया जाता है. डिफ़ॉल्ट मान सही होता है.
  • IgnoreSpace : एक तार्किक (सही/गलत) मान, जो समूहों को ढूँढने के लिए पाठ भागों के संयोजन की अनुमति देता है. उदाहरण के लिए, जब सही होता है, तो "Gra pes" को "Grapes" के साथ समूहीकृत किया जाता है. डिफ़ॉल्ट मान सही होता है.
  • SimilarityColumnName : उस स्तंभ का नाम, जो इनपुट मान और उस इनपुट के प्रतिनिधि मान के बीच की समानता को दर्शाता है. डिफ़ॉल्ट मान नल है, इस स्थिति में समानता के लिए एक नया स्तंभ नहीं जोड़ा जाएगा.
  • Threshold : 0.00 और 1.00 के बीच की संख्या जो समान होने का स्कोर दिखाती है जिस पर दो मान समूहीकृत किए जाएँगे. उदाहरण के लिए, "Grapes" और "Graes" (अनुपलब्ध "p") केवल तब ही समूहीकृत होते हैं जब यह विकल्प 0.90 से कम पर सेट हो. 1.00 का थ्रेशोल्ड केवल सटीक मिलान की अनुमति देता है. (ध्यान दें कि एक फ़ज़ी "सटीक मिलान" आवरण, शब्द क्रम और विराम चिह्न जैसे अंतरों की उपेक्षा कर सकता है.) डिफ़ॉल्ट मान 0.80 है.
  • TransformationTable : एक तालिका जो कस्टम मान मैपिंग के आधार पर रिकॉर्ड्स के समूहीकरण की अनुमति देती है. इसमें "प्रेषक" और "प्रेषित" स्तंभ शामिल होने चाहिए. उदाहरण के लिए, "Grapes" को "Raisins" के साथ समूहीकृत किया गया है, यदि कोई रूपांतरण तालिका "प्रेषक" स्तंभ वाले "Grapes" और "प्रेषित" स्तंभ वाले "Raisins" के साथ प्रदान की गई है. ध्यान दें कि रूपांतरण तालिका में पाठ की सभी पुनरावृत्तियों के लिए रूपांतरण लागू किया जाएगा. ऊपर दिए गए रूपांतरण तालिका के साथ, "Grapes are sweet" के साथ "Raisins are sweet" को भी समूहीकृत किया जाएगा.

Examples

Example #1

कर्मचारियों के स्थान के लिए प्रतिनिधि मान प्राप्त करें.

Table.AddFuzzyClusterColumn(
Table.FromRecords(
{
[EmployeeID = 1, Location = "Seattle"],
[EmployeeID = 2, Location = "seattl"],
[EmployeeID = 3, Location = "Vancouver"],
[EmployeeID = 4, Location = "Seatle"],
[EmployeeID = 5, Location = "vancover"],
[EmployeeID = 6, Location = "Seattle"],
[EmployeeID = 7, Location = "Vancouver"]
},
type table [EmployeeID = nullable number, Location = nullable text]
),
"Location",
"Location_Cleaned",
[IgnoreCase = true, IgnoreSpace = true]
)

Result:

Table.FromRecords(
{
[EmployeeID = 1, Location = "Seattle", Location_Cleaned = "Seattle"],
[EmployeeID = 2, Location = "seattl", Location_Cleaned = "Seattle"],
[EmployeeID = 3, Location = "Vancouver", Location_Cleaned = "Vancouver"],
[EmployeeID = 4, Location = "Seatle", Location_Cleaned = "Seattle"],
[EmployeeID = 5, Location = "vancover", Location_Cleaned = "Vancouver"],
[EmployeeID = 6, Location = "Seattle", Location_Cleaned = "Seattle"],
[EmployeeID = 7, Location = "Vancouver", Location_Cleaned = "Vancouver"]
},
type table [EmployeeID = nullable number, Location = nullable text, Location_Cleaned = nullable text]
)

Category

Table.Transformation