分散システムとポエム

Monthly Selection: Jan 2025

Elasticsearchと検索技術

検索に関連するトピックが網羅的にカバーされていてよかった.TD-IDFやOkapi BM25b,転置Indexを含めて網羅的に丁寧に説明されているためわかりやすい.

検索結果の品質向上 Elasticsearch入門 – Speaker Deck

On-call用サービス

少人数で無料の範囲で使えそうなサービスを探してみた.

  • Pagerduty
  • Opsgenie
  • Grafana IRM

CPUのレジスタとキャッシュ

CPUのレジスタとキャッシュを同じものと誤解していた.別物だったので今後は間違えないようにする.

CPUとメモリのアーキテクチャ:福田昭のデバイス通信 ARMが語る、最先端メモリに対する期待(3)(2/2 ページ) – EE Times Japan

GoogleのSREでの障害の捉え方

もとの記事は以下にある.メルカリ社内で共有されていて興味深かったので読んでみた.STAMP/STPAという安全工学の考え方を採用しており,興味深かった.

The Evolution of SRE at Google | USENIX

以下に読んだ感想をまとめた.障害を引き起こす直前の状態をハザードとして定義しており,ハザードの時点でハザード状態から復旧するようシステムを設計する考え方がとられていた.

“The Evolution of SRE at Google”を読んでみた | クラウド・分散システム研究室

システム障害の事例

以下にまとめたスプレッドシートを作りはじめた.障害の原因がどこにあるのか,どの程度の長さで発生しているのかをまとめた具体的なデータが見つからず,自分で収集することにした.

Web系のシステム障害 – Google スプレッドシート

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です