今日のセミナーでPalantir社のエンジニアとストラテジストが登壇してました。
pdfファイルもデータソースとしてクレンジングできるとのこと。
pdfから抽出したデータをスキーマに当て込む必要があるとは思うが、どこまで自動化できるかは気になった。
様々なデータソースから集めたデータを統合できるが、GDPRに配慮し、統合処理は顧客と一緒に行うとの言及もあり。