SAS Quality Knowledge Base for Contact Information 26
Definitions for the Thai, Thailand locale are described below.
Case Definitions
Extraction Definitions
Gender Analysis Definitions
Identification Analysis Definitions
Match Definitions
Parse Definitions
Pattern Analysis Definitions
Standardization Definitions
Inherited Definitions
None.
None.
None.
None.
Address | ||
---|---|---|
Description | The Address match definition generates match codes which can be used to cluster records containing addresses. | |
Max Length of Match Code | 80 characters | |
Examples | Input | Cluster ID |
156/2 สุขุมวิท22 | 1 | |
156/2 สุขุมวิท | 1 | |
3 คณะ8 วัดมหาธาตุ มหาราช | 2 | |
Remarks |
|
Address (Full) | ||
---|---|---|
Description | The Address (Full) match definition generates match codes which can be used to cluster records containing complete two-line addresses. | |
Max Length of Match Code | 120 characters | |
Examples | Input | Cluster ID |
146/12-14 ถ.สุขุมวิท 71 พระโขนงเหนือ วัฒนา | 1 | |
146/12-1450 ซ.สุขุมวิท 71 ถ.สุขุมวิท พระโขนง วัฒนา | 1 | |
3 วัดมหาธาตุ (คณะ8) ถ.มหาราช แขวงพระบรมมหาราชวัง เขตพระนคร | 2 | |
Remarks |
|
City | ||
---|---|---|
Description | The City match definition generates match codes which can be used to cluster records containing city names. | |
Max Length of Match Code | 15 characters | |
Examples | Input | Cluster ID |
องวาริน | 1 | |
องวารินชำราบ | 1 | |
เมืองนครปฐม | 2 | |
Remarks |
|
City - State/Province - Postal Code | ||
---|---|---|
Description | The City - State/Province - Postal Code match definition generates match codes which can be used to cluster records containing last line address information. | |
Max Length of Match Code | 40 characters | |
Examples | Input | Cluster ID |
ไทรม้า อ. เมือง | 1 | |
ไทรม้า เมือง | 1 | |
ดุสิต | 2 | |
Remarks |
|
Name | ||
---|---|---|
Description | The Name match definition generates match codes which can be used to cluster records containing names of individuals. | |
Max Length of Match Code | 30 characters | |
Examples | Input | Cluster ID |
น.ส. รัตนา เหลืองสวัสด | 1 | |
นางสาว รัตนา เหลืองสวัสด | 1 | |
นาง ละมูล บุญประเสริฐ | 2 | |
Remarks |
|
Organization | ||
---|---|---|
Description | The Organization match definition generates match codes which can be used to cluster records containing organization names. | |
Max Length of Match Code | 50 characters | |
Examples | Input | Cluster ID |
บจก. สุราทิพย์สวรรค์วิจิตร | 1 | |
บ. สุราทิพย์สวรรค์วิจิตร | 1 | |
บจก. สุราทิพย์แสนสุขโข | 2 | |
Remarks |
|
Phone | ||
---|---|---|
Description | The Phone match definition generates match codes which can be used to cluster records containing phone numbers. | |
Max Length of Match Code | 20 characters | |
Examples | Input | Cluster ID |
(02)9421108 | 1 | |
02 9421108 | 1 | |
027410037 | 2 | |
Remarks |
|
Postal Code | ||
---|---|---|
Description | The Postal Code match definition generates match codes which can be used to cluster records containing postal codes. | |
Max Length of Match Code | 15 characters | |
Examples | Input | Cluster ID |
10500 | 1 | |
10500. | 1 | |
11130 | 2 | |
Remarks |
|
Address | |||
---|---|---|---|
Description | The Address parse definition parses addresses into a set of tokens. | ||
Output Tokens | Post Office Info Building Number Building Name Village Number Village Name Extension Sub-Street Street |
||
Example | Input | Output Token | Output |
313 อ. ซี.พี.ทาวเวอร์ ชั้น 12 ถ. สีลม | Post Office Info | ||
Building Number | 313 | ||
Building Name | อ. ซี.พี.ทาวเวอร | ||
Village Number | |||
Village Name | |||
Extension | ชั้น 12 | ||
Sub-Street | |||
Street | ถ. สีลม | ||
Remarks |
Address (Full) | |||
---|---|---|---|
Description | The Address (Full) parse definition parses addresses containing complete two-line addresses into a set of tokens. | ||
Output Tokens | Post Office Info Building Number Building Name Village Number Village Name Extension Sub-Street Street District City Province Postal Code |
||
Example | Input | Output Token | Output |
313 อ. ซี.พี.ทาวเวอร์ ชั้น 12 ถ. สีลม ต. สีลม อ. บางรัก จ. กทม. 10500 | Post Office Info | ||
Building Number | 313 | ||
Building Name | อ. ซี.พี.ทาวเวอร | ||
Village Number | |||
Village Name | |||
Extension | ชั้น 12 | ||
Sub-Street | |||
Street | ถ. สีลม | ||
District | สีลม | ||
City | บางรัก | ||
Province | กทม. | ||
Postal Code | 10500 | ||
Remarks |
Address (Global) | |||
---|---|---|---|
Description |
The Address (Global) parse definition parses addresses into a globally recognized set of tokens. |
||
Output Tokens |
Recipient |
||
Example | Input | Output Token | Output |
313 อ. ซี.พี.ทาวเวอร์ ชั้น 12 ถ. สีลม | Recipient | ||
Building/Site | 313 อ ซี.พี.ทาวเวอร์ | ||
Street | ถ สีลม | ||
Extension | ชั้น 12 | ||
PO Box | |||
Additional Info | |||
Remarks | Parse definitions named with the Global keyword use a set of output tokens that is consistent across every locale. Results obtained from these definitions can be stored in the same database fields as the results obtained from definitions of the same name in other locales. |
City - State/Province - Postal Code | |||
---|---|---|---|
Description | The City - State/Province - Postal Code parse definition parses last line address information into a set of tokens. | ||
Output Tokens | District City Province Postal Code |
||
Example 1 | Input | Output Token | Output |
ต. สีลม อ. บางรัก จ. กทม. 10500 | District | สีลม | |
City | บางรัก | ||
Province | กทม. | ||
Postal Code | 10500 | ||
Example 2 | Input | Output Token | Output |
ต.บางสีทอง อ.บางกรวย จ.นนทบุรี 11130 | District | บางสีทอง | |
City | บางกรวย | ||
Province | นนทบุร | ||
Postal Code | 11130 | ||
Remarks |
City - State/Province - Postal Code (Global) | |||
---|---|---|---|
Description | The City - State/Province - Postal Code (Global) parse definition parses last line address information into a globally recognized set of tokens. | ||
Output Tokens | City State/Province Postal Code Additional Info |
||
Example 1 | Input | Output Token | Output |
ต. สีลม อ. บางรัก จ. กทม. 10500 | City | สีลม บางรัก | |
State/Province | กทม. | ||
Postal Code | 10500 | ||
Additional Info | |||
Example 2 | Input | Output Token | Output |
ต.บางสีทอง อ.บางกรวย จ.นนทบุรี 11130 | City | บางสีทอง บางกรวย | |
State/Province | นนทบุร | ||
Postal Code | 11130 | ||
Additional Info | |||
Remarks | Parse definitions named with the Global keyword use a set of output tokens that is consistent across every locale. Results obtained from these definitions can be stored in the same database fields as the results obtained from definitions of the same name in other locales. |
Name | |||
---|---|---|---|
Description | The Name parse definition parses names of individuals into a set of tokens. | ||
Output Tokens | Prefix Given Name Family Name |
||
Example 1 | Input | Output Token | Output |
นาย สมหมาย ใจด | Prefix | นาย | |
Given Name | สมหมาย | ||
Family Name | ใจด | ||
Example 2 | Input | Output Token | Output |
นาย สมชาย กล้าหาญ | Prefix | นาย | |
Given Name | สมชาย | ||
Family Name | กล้าหาญ | ||
Remarks |
Name (Global) | |||
---|---|---|---|
Description | The Name (Global) parse definition parses names of individuals into a globally recognized set of tokens. | ||
Output Tokens | Prefix Given Name Middle Name Family Name Suffix Title/Additional Info |
||
Example 1 | Input | Output Token | Output |
นาย สมหมาย ใจด | Prefix | นาย | |
Given Name | สมหมาย | ||
Middle Name | |||
Family Name | ใจด | ||
Suffix | |||
Title/Additional Info | |||
Example 2 | Input | Output Token | Output |
นาย สมชาย กล้าหาญ | Prefix | นาย | |
Given Name | สมชาย | ||
Middle Name | |||
Family Name | กล้าหาญ | ||
Suffix | |||
Title/Additional Info | |||
Remarks | Parse definitions named with the Global keyword use a set of output tokens that is consistent across every locale. Results obtained from these definitions can be stored in the same database fields as the results obtained from definitions of the same name in other locales. |
Organization | |||
---|---|---|---|
Description | The Organization parse definition parses organization names into a set of tokens. | ||
Output Tokens | Prefix Name Site Legal Form |
||
Example 1 | Input | Output Token | Output |
บมจ. เบียร์ไทย จำกัด (มหาชน) . | Prefix | บมจ. | |
Name | เบียร์ไทย | ||
Site | |||
Legal Form | จำกัด (มหาชน) | ||
Example 2 | Input | Output Token | Output |
บริษัท แซสซอฟส์แวร์ ไทยแลนด์ จำกัด | Prefix | บริษัท | |
Name | แซสซอฟส์แวร | ||
Site | ไทยแลนด | ||
Legal Form | จำกัด | ||
Remarks |
Phone | |||
---|---|---|---|
Description | The Phone parse definition parses phone numbers into a set of tokens. | ||
Output Tokens | Prefix Country Code Area Code Base Number Extension |
||
Example | Input | Output Token | Output |
โทรศัพท์. 02-632-1511-20 | Prefix | โทรศัพท์. | |
Country Code | |||
Area Code | 02 | ||
Base Number | 632-1511 | ||
Extension | 20 | ||
Remarks |
Phone (Global) | |||
---|---|---|---|
Description | The Phone (Global) parse definition parses phone numbers into a globally recognized set of tokens. | ||
Output Tokens | Country Code Area Code Base Number Extension Line Type Additional Info |
||
Example | Input | Output Token | Output |
โทรศัพท์. 02-632-1511-20 | Country Code | ||
Area Code | 02 | ||
Base Number | 632-1511 | ||
Extension | 20 | ||
Line Type | โทรศัพท์. | ||
Additional Info | |||
Remarks | Parse definitions named with the Global keyword use a set of output tokens that is consistent across every locale. Results obtained from these definitions can be stored in the same database fields as the results obtained from definitions of the same name in other locales. |
None.
Address | ||
---|---|---|
Description | The Address standardization definition standardizes addresses. | |
Example | Input | Output |
313 อ. ซี.พี.ทาวเวอร์ ชั้น 15 ถ. สีลม | 313 อาคาร ซีพีทาวเวอร์ ชั้น 15 ถนน สีลม | |
Remarks |
Address (Full) | ||
---|---|---|
Description | The Address (Full) standardization definition standardizes complete two line addresses. | |
Example | Input | Output |
313 อ. ซี.พี.ทาวเวอร์ ชั้น 15 ถ. สีลม ต. สีลม อ. บางรัก จ. กทม. 10500 | 313 อาคาร ซีพีทาวเวอร์ ชั้น 15 ถนน สีลม สีลม บางรัก กรุงเทพมหานคร 10500 | |
Remarks |
City | ||
---|---|---|
Description | The City standardization definition standardizes city names. | |
Example | Input | Output |
พิบูลฯ | พิบูลมังสาหาร | |
Remarks |
City - State/Province - Postal Code | ||
---|---|---|
Description | The City - State/Province - Postal Code standardization definition standardizes last line address information. | |
Examples | Input | Output |
สีลม บางรัก กทม. 11150 | สีลม บางรัก กรุงเทพมหานคร 11150 | |
สีลม บางรัก กรุงเทพฯ | สีลม บางรัก กรุงเทพมหานคร | |
Remarks |
Name | ||
---|---|---|
Description | The Name standardization definition standardizes names of individuals. | |
Examples | Input | Output |
พ.ต. แดง ใจด | พันตรี แดง ใจด | |
พ.ต.ท.ดร.ทักษิณ ชินวัตร | พตท ดร ทักษิณ ชินวัตร | |
Remarks |
Organization | ||
---|---|---|
Description | The Organization standardization definition standardizes organization names. | |
Example | Input | Output |
บจก. ที.ซี.ซี.โลจิสติคส | บริษัทจำกัด ทีซีซีโลจิสติคส | |
Remarks |
Phone | ||
---|---|---|
Description | The Phone standardization definition standardizes phone numbers for domestic use. | |
Example | Input | Output |
026321511-20 | 02 6321511 20 | |
Remarks |
Postal Code | ||
---|---|---|
Description | The Postal Code standardization definition standardizes postal codes. | |
Example | Input | Output |
11130. | 11130 | |
Remarks |
In addition to the definitions listed on this page, the Thai, Thailand locale also inherits all definitions for the Thai language and all Global definitions.
Documentation Feedback: yourturn@sas.com |
Doc ID: QKBCI_THTHA_defs.html |