- 名寄せ・データクレンジング
【DB会社が解説】名寄せとは? 顧客データを整備・管理する方法を徹底解説!
更新日: 2023年6月19日
この記事にたどり着いた方は、「社内データを名寄せしようとしたけど挫折した」もしくは「名寄せしようとしているがなにから手を出したらよいかわからない」といった課題を持った方が多いのではないでしょうか。
この記事では、SFAやCRMなどの社内に散在するデータを名寄せする方法を5段階のステップで解説します。LEVELの低い方からお試しいただくことをおすすめします。
目次
こちらの記事もおすすめ!
名寄せとは、元々は金融用語で、ひとつの金融機関に存在する複数の口座をひとつに統合することを指します。
現在ではそこから転じて、口座以外にもデータベース上に存在する同一のデータをひとつに統合するという意味合いでも使われるようになりました。
名寄せ=データベース上に存在する同一のデータをひとつに統合すること
一口に名寄せと言っても様々な種類がありますが、「企業内に存在するデータベースの名寄せ」という意味合いでは大きく、個人名寄せと企業名寄せの二つに分類できます。
個人名寄せとは、データベース内の同一人物を一つのデータに統合することです。取引先責任者やリードなど個人単位のデータが代表例です。SFAやMAは人単位でデータを管理することが基本となるため、営業のコンタクトデータを正確に管理するには、個人名寄せが重要になります。
企業名寄せとは、データベース内の同一企業を一つのデータに統合することです。取引先や仕入先など企業単位のデータが代表例です。顧客データの管理や、営業先バッティングの防止、ABMの実施のために重要になります。
個人名寄せは、姓名+メールアドレス(電話番号)など表記ゆれのしづらい名寄せキーが設定しやすく、比較的実施がしやすいです(決して容易ではない)。
一方で企業名寄せは、企業名や所在地は表記ゆれが発生しやすく、中小・零細・官公庁や事業所単位になるほど統一のキーが設定しづらくなります。
本記事では、より難易度が高く、重要度も高い、「企業データの名寄せ」を中心に解説していきます。
上記の通り、一口に名寄せと言っても様々な種類があります。名寄せを実施する目的に応じて、対象となるデータや名寄せのルールが変わってくるため、名寄せを行う前に「何のために名寄せを行うのか」を明確に定義し、メンバーの共通認識とすることが何より大切です。
目的は、メリットから逆算して考えましょう。代表的なメリットは以下。
●営業のバッティングを防ぐ
●データの精度が上がることで、マーケティング活動や営業活動が適切に行える
●既存顧客の分析から、適切な新規開拓先を見つける
(名寄せ以外にもデータの拡充方法について検討する必要があるかもしれません)
目的に合わせて名寄せを行う対象データを決めましょう。CRMやSFA、MA、名刺管理など社内データが散在している場合は、データウェアハウス(データの蓄積先)を検討しましょう。
対象データを決めたら、名寄せのルールを決めましょう。
名寄せのルールで決めるべきことは大きく、「名寄せキー」と「名寄せロジック」の二つです。
キー:重複判断の条件とする情報。
ロジック:名寄せのキーが同一のデータの優先順位など名寄せのキーでカバーできない範囲をルールとして決定する。
名寄せキーには、個人ならばメールアドレス、企業ならば法人番号など、データの実情と一意で紐づく記号やコードを設定することが理想的です。
名寄せキーが空白や、同一のデータが存在するなど名寄せキーでカバーできない範囲の名寄せルールをロジックとして規定します。
例えば、メールアドレスをキーとした場合に、メールアドレスが同一のデータについては、姓名が空白でないデータを優先して名寄せを行うといった具合です。
また、全てのデータ重複を完全になくすことは困難なため、どこまで名寄せし、どこからはデータをそのまま保持するのかという境界線を決めることも重要です。
ここから実際の名寄せ処理のステップです。もし社内でCRMやSFAといった営業支援システムを使用している場合、多くのツールには標準機能として名寄せ機能が備わっておりそちらを使用することで重複データの管理が可能になります。
ここでは、代表的なCRM・SFAツールであるSalesforce社のSales Cloud(セールスクラウド)を例に説明してきます。
Salesforceには重複管理の標準機能として「一致ルール」「重複ルール」があります。
一致ルールは、項目値を比較して、あるレコードと既存のレコードが重複しているとみなされるほど、十分に類似しているかどうかを判断します。
たとえば、一致ルールは、2 つのレコードのメールと電話の値が完全に一致する場合、レコードは重複していると指定できます。-Sales Cloud:一致ルールとは?
重複ルールは、一致ルールと連動してユーザが重複したレコードを作成するのを防止します。
一致ルールは、ユーザが作成または更新するレコードに、他のレコードと重複するとみなすのに十分な類似性があるかどうかを判定し、一方、 重複ルールは、重複が識別されたときに実行するアクションを Salesforce に指示します。
たとえば、重複ルールでは、重複の可能性があると識別されたレコードをユーザが保存できないようにブロックしたり、 ユーザに作成するレコードが重複する可能性があるとアラート通知のみを行い、レコードの保存を許可したりすることもできます。-Sales Cloud:重複ルールとは?
一致ルールと重複ルールは、Salesforce上の[設定]>[データ]>[重複管理]から設定を行うことができます。
オブジェクトごとの項目設定や、完全一致・あいまい一致の設定もできるので目的に応じて条件を設定することで、レコードの作成・編集時に重複を察知し、データの名寄せを行うことができます。
より詳細を確認したい方は、Salesforceのガイドラインをご確認ください。
CRMやSFAの標準機能は制限が多く満足のいく名寄せが行えないという方は、対象のシステムからデータを一旦エクスポートして、Excel等の表計算ソフトで手動で名寄せを行うという方法もあります。
Excel等の表計算ソフトのメリットはその自由度の高さにあります。適当な関数を活用することで、より複雑な条件設定や処理も可能です。代表的な関数は以下です。
JIS関数 | 半角文字を全角文字に置き換える |
ASC関数 | 全角文字を半角文字に置き換える | TRIM関数 | 余分な空白を削除する |
CLEAN関数 | 改行を削除する |
CONCATENATE関数 | 文字列を統合する |
VLOOKUP関数 | 特定の項目値が一致する別の列の値を抽出する | XLOOKUP関数 | 特定の項目値が一致する別の列の複数の値を抽出する |
IF関数 | 条件分岐をつくる |
複数の意味にとりやすい項目は分けて管理することが重要です。例えば、「企業名」という項目だけだと、法人格があったりなかったり、事業所名も入っていたりといった問題が起きがちですが、「法人格」「企業名」「事業所名」とあらかじめ項目を分けて保持することで、データの誤入力は減少します。項目を分けることでデータの入力規則を設定しやすくなることも大きなメリットです。
抽出したデータの名寄せが終わったら、データをインポートします。この際、システム上に保管されている一意のIDを使ってインポートすることを徹底しましょう。IDを使わない場合、インポートデータの多くが新たに生成され、重複データが大量に発生する可能性があります。
項目を新たに作成した場合は、該当の項目をCRMやSFA上にあらかじめ作成しておくことも忘れないようにしましょう。
表記ゆれやデータ不備の種類や原因は多岐に渡ります。特に企業情報に関しては、社名変更、住所移転、合併、倒産等、日々情報は更新されています。
これらの変化をすべてとらえ、社内リソースだけでメンテナンスすることは現実的ではありません。
専門の名寄せツールを使えば、企業情報の変更をとらえ自動で情報がメンテナンスされます。情報入力も専用ツールを経由して行うことで、きれいなデータが保たれます。
また、専用ツールにより付与される一意のコードを利用することで、社内のシステムごと、部署ごと、事業拠点ごとにバラバラに管理されていた情報の一元管理が可能になります。
足りない情報は、搭載された企業情報データベースから補填されるので、データを使った営業活動の効率化を可能にします。
手動での名寄せとどこが違うのか、具体的にどう名寄せを実現するのか、など詳細情報は以下よりご確認ください!
本記事では、社内に存在するデータの名寄せ方法について、5段階のステップで解説しました。
名寄せは、踏み込めば踏み込むほど奥が深く難解な業務です。社内リソースでの対応に限界を感じたら、ぜひ専門ツールの導入をご検討されてはいかがでしょうか。
この記事を書いた人
ユーソナー編集部
MXグループ・編集長
ユーソナー編集部です。
主にBtoB事業を営む企業様に向け、これからの業務のあり方を考える上で有用なデータ活用やデジタル技術に関する情報を発信しています。
ユーソナーは業種・業界問わず
様々な企業において活用いただいております。
ITreview Grid Award 2025 Winter
リーダー認定4部門