proxmox
Proxmox + Terraform + k3s の構成でハマる原因は、技術不足ではなくAWS前提の思考がそのまま通らないことにあります。 代表的な詰まりポイントはboot_order、qemu-guest-agent、SSH認証経路の3つです。 何が起きたか Proxmox上にTerraformでVMを作って、clo…
Proxmox上にTerraform + cloud-initでk3sクラスタを構築してたんですけど、terraform apply が失敗するたびに原因の特定に時間がかかる。 「VM自体が作れてないのか」「VMは作れたけどcloud-initが途中で止まったのか」「k3s serverは起動したけどworker joi…
Proxmox上でKubernetesを動かしているとき、永続ストレージをどうするかは悩みどころです。LonghornやRook-Cephを入れると管理レイヤーが増える。 Proxmox CSI Plugin(sergelogvinov/proxmox-csi-plugin)を使うと、Proxmox側のストレージプールをそのままP…
Proxmox上にTerraformでVMを作って name = "k3s-cp1" と設定したのに、SSHで入ると hostname が ubuntu のまま。原因は user_data_file_id でカスタムcloud-configを指定すると、Proxmoxの暗黙のhostname設定が効かなくなることでした。cloud-configに hostn…
bpg/proxmox providerで agent { enabled = true } を設定した状態でVMを作成すると、Still creating... が12分以上続いてタイムアウトすることがあります。 原因はVM内にqemu-guest-agentがインストールされていないこと。cloud-initで自動投入するのが確実…
bpg/proxmox providerで user_data_file_id と user_account を同時に指定すると、SSH鍵がVM内に反映されませんでした。なんでだろうって調べてみたところ、カスタム user-data が Proxmox自動生成の user-data を丸ごと置換するのが原因でした。 エラー内容…
Proxmox VM上のKubernetesでLonghornを使っていて、VMバックアップの時間帯だけPVCが不安定になる場合、原因の多くはI/O経路の多段化にあります。根本的に解決するなら、Proxmox CSI PluginやCeph CSIで永続化レイヤーを1段減らすことを検討してみてください…
Proxmox上でk3sクラスターをTerraformで構築してたんですよ。cloud-initテンプレートからVM 3台を作成したら、terraform apply が延々と Still creating... を出し続けて、完了まで10分近くかかった。 proxmox_virtual_environment_vm.k3s_worker[0]: Still …
qm create で --net0 を指定してテンプレートを作ると、boot orderが net0 だけになることがあります。このテンプレートからcloneしたVMを起動するとディスクからブートせずiPXEループに入ります。qm set <vmid> --boot order=scsi0 で解決します。 確認環境: Prox</vmid>…
bpg/proxmox providerで proxmox_virtual_environment_file(snippets)を作ろうとしたらSSH認証エラーになった。調べてみたところ、providerがファイルアップロードだけSSH/SFTP経由で行うためだった。ってことで、APIトークンとは別にSSH接続の設定が必要…
terraform destroy → terraform apply でVMを再作成した後にSSHが通らなくなるのは、~/.ssh/known_hosts に残っている古いホスト鍵と新VMのホスト鍵が一致しないため。ssh-keygen -R <IP> で古い鍵を消せば解決します。 何が起きたか ProxmoxのVM構成をTerraform</ip>…