2026年5月某日、生成AI利活用を推進する有志による「Hacking Fest 2026 Spring」が開催されました。
Hacking Festとは?
Hacking Festは、ゴールデンウィーク期間中に行った技術キャッチアップや個人の成果を共有し、開発者間の相互学習の機会を提供するために開催しています。社内エンジニアが生成AIを活用して実際の業務と日常の問題を解決した事例が、9件のセッションで紹介されました。
前回冬の開催に続き、今回もゴールデンウィーク中の取り組みを中心に幅広いテーマが集まりました。AIエージェントの制御手法から個人開発、業務効率化、そして未来を想像するポエムまで、エンジニアたちの多彩な挑戦が共有されました。本記事では、どのようなセッションが行われたのかと、筆者の所感を紹介します。
セッション1:Harness Engineering 概念整理
発表者:Soonhwan Kwon
AIコーディングエージェントをより安定的に活用するためのアプローチとして、Harness Engineeringに関する調査内容が共有されました。
発表では、会話が長くなるほど前の文脈を参照しづらくなるContext Decayや、指示だけでは意図しない動作を完全には防ぎにくいといった、AIエージェント活用時の課題が取り上げられました。これらの課題に対して、プロンプトやコンテキストを工夫するだけでなく、エージェントが動く環境や検証ループを設計することの重要性が説明されました。
具体例として、失敗から再発防止ルールを追加していく考え方、作業前後のFeedforward/Feedbackループ、静的解析やテストによる機械的な検証、LLM判断を活用した推論的な検証などが紹介されました。最後に、AIによる自動化と人間による確認を組み合わせながら、より安全にAIエージェントを活用していく方向性が示されました。
セッション2:Claude Code HooksでAuto Modeを自作する

発表者:Suzuki Kosuke
鈴木さんはClaude CodeのHooks機能を活用してAuto Modeと同等の機能を自作した経験を発表しました。
個人開発ではClaude Proプランがコスト的に適切だと感じていたものの、当時のProプランではAuto Modeが使えなかったため、自分で似た動作を作ってみることにしたという経緯でした。まずClaude Code Hooksがセッション開始・終了、ツール呼び出し前後、権限リクエストなどさまざまなイベントでスクリプトやプロンプトを実行できる拡張機能であることを説明しました。
実装ではPermissionRequestイベントを利用して「このツール使用を承認するか」をLLMに判断させ、Stopイベントを利用して作業終了後も残りタスクがあれば自動で続行するようにしました。自動承認機能はClaude APIを呼び出すシェルスクリプトベースのフックで実装し、承認・拒否結果をJSON形式で返すように構成しました。ただしPrompt Hookは出力スキーマが固定されていて望むJSON形式を作りにくく、claude -p方式も期待した形式を安定的に返せませんでした。発表者はこれを通じて実際のAuto Modeが想像以上に精緻に設計されていることを実感し、自作の実装は結局公式Auto ModeがProプランにも提供されたことで実用の必 要性は減ったものの、Hooksを深く理解する良い学習になったとまとめました。
セッション3:2028年のゴールデンウィークを想像したポエム

発表者:Maekawa Kohei
前川さんは技術的な開発成果の代わりに、「2026年のゴールデンウィークが2028年だったらどう変わっていただろうか」という予想から出発した発表を行いました。
発表では、未来の生成AIが予定管理、移動、家計管理、意思決定、健康管理、作業支援など、生活のさまざまな場面に自然に入り込む可能性が語られました。一方で、生成AIが多くの提案や自動化を担うようになっても、人間関係や価値判断を含む領域では、最終的な判断は人間に残り続けるという視点が示されました。
発表の結論は、未来においても人間の中心的役割は「判断し、その判断に責任を持つこと」というメッセージでした。
セッション4:Amazon PhotosのデータをNASにバックアップした話

発表者:Washizu Yoshitsugu
鷲巣さんは、長年クラウド上に保管してきた写真データを、ローカル環境にもバックアップした取り組みについて共有しました。
発表では、クラウドサービスの利便性を活用しつつも、サービス障害や利用条件の変更などに備えて、自分で管理できる場所にもデータを保持しておく重要性が語られました。大量の写真データを扱ううえでは、手作業だけで整理・移行することが難しいため、AIの支援も活用しながら、効率的にデータを整理・保存する方法を検討したとのことです。
最終的には、写真データをローカル環境にバックアップする仕組みを整え、個人データを長期的に守るためには、クラウドだけに依存しない備えが大切だというメッセージで締めくくられました。
セッション5:AI利用コストを抑えるための試行錯誤

発表者:Yoshizawa Takayuki
吉澤さんはAI利用コストを抑えるために試みたさまざまなアプローチとその失敗経験をユーモラスに共有しました。
問題意識はシンプルでした。AI APIや有料ツールの使用コストが高いため、より安価に同等の効果を得る方法がないかという悩みです。
まずローカルLLMを直接実行すれば使用量に応じたコスト負担を減らせるのではないかと実験しました。しかし個人のMac環境で動かせるモデルはサイズと性能に制約が大きく、期待した品質の出力を得にくかったり速度面で実用的ではありませんでした。続いて自宅にAI専用サーバーを構築する選択肢も検討しましたが、一定水準以上のモデルを安定して動かすには大容量のメモリと高 性能GPUが必要で初期コストが大きかったと説明しました。結論として、今回試した範囲では無料・低価格・自動化・高性能を同時に満たす方法は見つからず、コストを減らすにはむしろ先に大きな初期投資が必要だという現実的な教訓を共有しました。
セッション6:LLM評価ツールでClaude Skillを評価・改善

発表者:Inoue Satoshi
LLM評価ツールを活用して自身が普段使用していたClaude Skillを評価・改善した実験を紹介しました。
対象のSkillはClaude関連のアップデート情報を収集して週次レポートに整理するツールで、Claude公式ドキュメントや社内向けの共有情報を入力としてレポートを生成する仕組みでした。基本のサンプルスクリプトはAIとのプロンプト・応答中心のデータを送る構造でしたが、実際に評価したかったのは最終的に生成されたレポート内容だったため、スクリプトを修正して結果ドキュメント自体も収集するようにしました。
その後ツールの評価機能から簡潔性、内部整合性、ハルシネーション、コンテキストとの一致度などを選んで評価を実施しました。評価の結果、レポートがやや冗長だという指摘、Skillに定義された一部ルールに違反しているという指摘、データソースが不足してハルシネーション判断が曖昧な部分などが確認されました。指摘事項をClaudeに伝えてSkillを修正し再実行する改善ループを実施したところ、スコア が単純に一貫して上がるわけではなかったものの、指摘の具体性が高まり一部の問題が改善される効果を確認しました。発表者はこうしたLLM評価ツールがAIツールやSkillを定量・定性的に点検する上で有用な出発点になりうると整理しました。
セッション7:個人秘書エージェントを少し改善した話

発表者:Liu Wenjie
個人的に運用してきた秘書エージェントを改善した経験を共有しました。
このエージェントは、業務上必要な情報やタスク関連情報をもとに、毎朝必要な情報を整理したり、会議準備・レポート生成などに活用するために作ったツールでした。初期は有用に機能していましたが、約3か月間データが蓄積されるにつれて特定チケットの状態を誤って伝えたり、実際にはやっていない作業をやったかのように説明するなどハルシネーションが増えたと説明しました。原因として、データ整理フォーマットが最初から十分に設計されておらず、ドキュメント間の関係や時系列情報が不足していたことを挙げました。
これを解決するために、GBrainというGraphベースのPersonal Knowledge Managementツールを導入し、ドキュメント間のリンクや関係性、時間情報を自動的に補強する方式を実験しました。
導入後は、進行中ではないチケットを進行中だと誤って報告する問題などが改善され、時系列や関係性を反映した回答をより適切に生成できるようになりました。
また、LLM Judgeを活用して改善前後を複数の評価軸で比較し、単純にデータを多く集めることよりも、AIが理解しやすい構造で整理することが重要だと強調しました。
セッション8:生成AIでモニタリング業務の効率化に挑戦
発表者:Koga Yasunori
LINE関連サービスの運用業務において、生成AIを活用してモニタリング業務の効率化を目指す取り組みを共有しました。
ユーザー投稿コンテンツを確認し、必要に応じて適切な対応につなげる業務では、日々多くのコンテンツが扱われており、効率的な運用が課題になっているとのことでした。発表では、AIを活用して確認作業の一部を支援し、モニタリング業務の効率化を目指す取り組みが紹介されました。
既存の業務マニュアルや判断基準を参考に、生成AIがどの程度判断支援に活用できるかを検証しました。簡単なサンプルデータでは良好な結果が得られた一方で、曖昧なケースでは課題も確認されました。プロンプトの改善により精度が向上する傾向も見られました。発表者は、実データの取り扱いには十分な配慮が必要であり、関係部門と確認しながら慎重に検証を進めていると説明しました。
セッション9:Claude Designで個人サービスを開発
発表者:Sueishi Hiroki
居石さんは、Claude Designを活用した個人サービス開発の取り組みについて発表しました。
発表では、生成AIを使ってサービスの世界観やUIイメージを短時間で具体化し、画面モックの作成から実装ま でを効率的に進める流れが紹介されました。デザインの初期検討やコンポーネント設計にもAIを活用することで、個人開発における試行錯誤の負荷を下げられる可能性が示されました。
また、生成されたデザインをもとに実装へつなげる流れや、クラウド環境を活用した公開方法にも触れられました。発表全体を通じて、生成AIを活用することで、アイデアの具体化からサービス公開までをより軽量に進められるという学びが共有されました。
個人的な感想
今回のHacking Festで特に印象的だったのは、さまざまな分野を担当するエンジニアたちが、それぞれの日常や業務の中からAIを活用する独自の視点を見つけ出し、実験を重ねている姿でした。エージェントをいかに安定させるか、どう制御し改善するかという試行錯誤が多くのセッションに共通していた点も興味深く感じました。モデルとエージェントの進化が続く中、1年後にはどのような新しいテーマが語られるのか、今から楽しみです。


