Redshiftのテーブルにエンコーディングを指定する際のよい方法はありますか?

Redshiftは初回データロード時に、エンコーディング(Compression Encoding)を自動で判定するオプションを提供していますが、自動判定が機能するにはRedshift 1ノードあたり20万件以上のデータが必要となっています。

弊社がこれまでご支援させていただきました実績から見るに、初回データロード時からそれだけのデータがあることはまれであり、初回からエンコーディングを指定することはあまり現実的ではないと思われます。

エンコーディングをご利用いただく際は、数百万レコードほどデータが溜まった後に、ANALYZE COMPRESSION コマンドで最適なエンコーディングを取得して、テーブルを再作成する方法が現実的であり、おすすめしております。

テーブル再作成方法については下記を参照ください。

Redshiftのカラム変更(カラム名、データ型など)はどのような手順になりますか?

 

他にご質問がございましたら、リクエストを送信してください

0 コメント

ログインしてコメントを残してください。
Powered by Zendesk