Redshiftのテーブルにエンコーディングを指定する際のよい方法はありますか?
Redshiftは初回データロード時に、エンコーディング(Compression Encoding)を自動で判定するオプションを提供していますが、自動判定が機能するにはRedshift 1ノードあたり20万件以上のデータが必要となっています。
弊社がこれまでご支援させていただきました実績から見るに、初回データロード時からそれだけのデータがあることはまれであり、初回からエンコーディングを指定することはあまり現実的ではないと思われます。
エンコーディングをご利用いただく際は、数百万レコードほどデータが溜まった後に、ANALYZE COMPRESSION コマンドで最適なエンコーディングを取得して、テーブルを再作成する方法が現実的であり、おすすめしております。
テーブル再作成方法については下記を参照ください。