Organization
Match Definition
Organization | |||
---|---|---|---|
Description |
The Organization match definition generates match codes which can be used to cluster records containing organization names. |
||
Max Length of Match Code | 35 characters | ||
Examples 1 Sensitivities 95 - 100 |
ID | Input | Cluster ID |
1 | タナカ鉄工株式会社 | 1 | |
2 | タナカ鉄工株式会社 | 1 | |
3 | ソニー株式会社大阪第1工場 | 2 | |
4 | ソニー株式会社大阪第2工場 | 3 | |
5 | ㈱ソニー北九州工場 | 4 | |
6 | 國學院大學 | 5 | |
7 | 国学院大学 | 6 | |
8 | 株式会社くぼた | 7 | |
9 | 株式会社クボタ | 8 | |
10 | インシュアランスとうきょう | 9 | |
11 | インシュアランスとうきゅう | 10 | |
12 | Mitsubishi UFJ Financial Group | 11 | |
13 | 株式会社三菱UFJフィナンシャル・グループ | 12 | |
14 | Kabushiki-gaisha Mitsubishi Yūefujei Finansharu Gurūpu | 13 | |
Examples 2 Sensitivities 90 - 94 |
ID | Input | Cluster ID |
1 | タナカ鉄工株式会社 | 1 | |
2 | タナカ鉄工株式会社 | 1 | |
3 | ソニー株式会社大阪第1工場 | 2 | |
4 | ソニー株式会社大阪第2工場 | 2 | |
5 | ㈱ソニー北九州工場 | 3 | |
6 | 國學院大學 | 4 | |
7 | 国学院大学 | 5 | |
8 | 株式会社くぼた | 6 | |
9 | 株式会社クボタ | 7 | |
10 | インシュアランスとうきょう | 9 | |
11 | インシュアランスとうきゅう | 10 | |
12 | Mitsubishi UFJ Financial Group | 11 | |
13 | 株式会社三菱UFJフィナンシャル・グループ | 12 | |
14 | Kabushiki-gaisha Mitsubishi Yūefujei Finansharu Gurūpu | 13 | |
For sensitivities 90-100, Organization name and site information are evaluated. Half-width and full-width Katakana are matched. Company legal forms are ignored. | |||
Examples 3 Sensitivities 50 - 89 |
ID | Input | Cluster ID |
1 | タナカ鉄工株式会社 | 1 | |
2 | タナカ鉄工株式会社 | 1 | |
3 | ソニー株式会社大阪第1工場 | 2 | |
4 | ソニー株式会社大阪第2工場 | 2 | |
5 | ㈱ソニー北九州工場 | 2 | |
6 | 國學院大學 | 3 | |
7 | 国学院大学 | 3 | |
8 | 株式会社くぼた | 4 | |
9 | 株式会社クボタ | 4 | |
10 | インシュアランスとうきょう | 5 | |
11 | インシュアランスとうきゅう | 6 | |
12 | Mitsubishi UFJ Financial Group | 7 | |
13 | 株式会社三菱UFJフィナンシャル・グループ | 7 | |
14 | Kabushiki-gaisha Mitsubishi Yūefujei Finansharu Gurūpu | 7 | |
For sensitivities 50-89, Organization name is evaluated. Half-width and full-width Katakana are matched. Company legal forms are ignored. Old style Kanji and modern Kanji are matched. Katakana, Hiragana and Romaji are matched. | |||
Remarks | In addition, as the sensitivity drops the number of characters in the matchcode is reduced and more records may be matched. |