
"단톡방에 사고가 났는데 그냥 넘기지 말고 다음에 같은 일이 안 일어나게 정리하고 싶어요."
권장. 사고 1건당 30분 회고가 운영자 학습 + 단톡방 신뢰의 가장 큰 차이를 만듬. 본 글은 4 섹션 회고 템플릿 + 5 핵심 질문.
회고가 필요한 사고 유형
사고 유형 우선순위 매트릭스
P1 (즉시 회고) / P2 (분기별 묶음) / P3 (운영 안정성) 7가지 사고 유형 분류.
봇 들킴
단톡방 신뢰 영향
광고 봇 응대
멤버 이탈 위험
환불 / 분쟁
법적 책임
멤버 신고
단톡방 추방 위험
데이터 손실
운영 연속성
톤 이탈
자연성 점진 손상
응답 지연
운영 안정성
P1 사고 모두 30분 회고 권장. P2~P3 는 분기별 모아서 회고.
4 섹션 회고 템플릿
사고 회고 — [날짜] [사고 한 줄 요약]
## 1. 사실 (What happened)
- 사고 발생 시점
- 사고 전체 흐름 (5분 단위)
- 영향 받은 단톡방 / 멤버 / 응답 수
- 운영자 인지 시점 (얼마나 늦었나)
- 사고 종료 시점
## 2. 영향 (Impact)
- 단톡방 멤버 반응 (이탈 / 분쟁 / 신고)
- 단톡방 신뢰 지표 변화 (호응율 / 가입율 / 이탈율)
- 운영자 시간 부담 (사고 대응 / 후속 응대)
- 법적 / 정책 위험 (있다면)
## 3. 원인 (Root cause)
- 직접 원인 (예: 페르소나가 광고 봇 메시지에 응답)
- 간접 원인 (예: 광고 봇 차단 룰 누락)
- 시스템 원인 (예: 운영자 부재 시간대에 멤버 신고)
- 운영자 결정 / 룰 / 시간 관리 영향
## 4. 재발 방지 (Prevention)
- 페르소나 / 단톡방 룰 / 운영자 정책 변경
- 단톡방 사고 안내 / 멤버 응대 / 사후 조치
- 자동화 룰 보강 (트리거 / 금지어 / hard-banned phrase)
- 정기 점검 일정 갱신
5 핵심 질문 (각 섹션 자가 점검)
사고 타임라인 시각화 예시
사고 시작 → 영향 확산 → 운영자 인지 → 대응 → 종료. 인지 지연 (orange) 이 회복 시간에 큰 영향.
1. 사고가 언제 시작했나?
명확한 시작 시점. 사고 인지보다 사고 시작이 보통 더 이름. Replyer 의 Activity / Logs 페이지에서 응답 / 사고 메시지 시점 확인.
2. 무엇이 잘못됐나?
사실 위주 (운영자 평가 / 감정 X). 멤버 1명의 사적 의견인지 / 운영 시스템 실패인지 구분.
3. 왜 발생했나?
직접 원인 + 간접 원인 + 시스템 원인 3 단계. "5 Why" 기법 활용 — 같은 질문 5번 반복하며 근본 원인 추적.
5 Why 추적 트리
광고 봇 응답 사고를 5단계로 거슬러 올라가 시스템 원인 도달.
4. 영향 범위는?
- 영향 멤버 수
- 영향 단톡방 수 (단톡방 다중 운영 시)
- 영향 시간 (사고 시작 → 종료)
- 영향 지표 (호응율 / 이탈율 등 변화)
5. 다음번엔 어떻게 막을까?
구체적 / 실행 가능한 룰 변경. "주의하자" 같은 추상 X. 예:
- 페르소나 hard-banned phrase 에 "환불" / "분쟁" 추가
- 광고 봇 차단 트리거 정규식 보강 (URL 검출 / 영문 비율 30%+)
- 운영자 정기 점검에 "광고 봇 진입 점검" 항목 추가
- 사고 키워드 매칭 시 운영자 webhook 즉시 알림
사고 회고 후 적용 흐름
Mermaid: 사고 → 회고 → 적용 의사결정 흐름
사고 발생부터 1주일 후 재점검까지의 운영자 의사결정 트리.
flowchart TD
A[사고 발생] --> B{P1?}
B -- Yes --> C[24h 후 회고 시작]
B -- No --> D[분기 회고 큐 적재]
C --> E[4섹션 + 5질문 작성]
E --> F[즉시 적용 24h]
F --> G[페르소나 prompt 갱신]
F --> H[hard-banned phrase 추가]
F --> I[단톡방 핀 갱신]
G --> J[48h 멤버 안내]
H --> J
I --> J
J --> K[1주일 후 재점검]
K --> L{영향 회복?}
L -- Yes --> M[기록 보존]
L -- No --> N[추가 룰 변경 + 재회고]
N --> F
즉시 적용 (24시간 내)
- 페르소나 prompt 갱신 (트리거 / 금지어)
- 단톡방 핀 메시지 갱신 (필요 시)
- 운영자 정책 갱신 (운영자 노트)
단톡방 멤버 안내 (48시간 내)
- 사고 사실 솔직 안내 (운영자 응대)
- 사후 조치 명시
- 멤버 의견 / 질문 받기
1주일 후 재점검
- 사고 영향 회복 확인 (호응율 / 이탈율 등 정량 지표)
- 룰 변경의 부작용 (false positive 등) 확인
- 운영자 본인 정신 / 시간 부담 점검
운영자 본인 회고
사고 회고는 단톡방 시스템 회고이지만 운영자 본인 회고도 필요:
- 사고 인지가 늦은 이유 (운영자 점검 누락? / 알림 채널 부재?)
- 사고 대응 시 운영자 감정 (분노 / 회피 / 불안)
- 단톡방 운영 지속 vs 폐쇄 검토
운영자 번아웃 신호 인지. 자세한 회복은 운영자 번아웃 회복 가이드 참고.
회고 함정 5가지
1. 사고 직후 회고
감정 영향 → 객관 X. 사고 24시간 후 회고 권장. 운영자 정서 안정 후 사실 / 영향 정리.
2. 비난 위주
특정 멤버 / 운영자 비난 → 학습 X. "왜" 에 집중, "누구" 회피.
3. 추상적 재발 방지
"더 주의" / "다음번엔 잘" 등 추상 X. 구체적 / 실행 가능 룰만.
4. 회고 후 룰 미적용
회고만 하고 단톡방 룰 / 페르소나 변경 X → 같은 사고 반복. 즉시 적용 흐름 필수.
5. 회고 기록 보존 X
회고 내용을 기록 안 함 → 6개월 후 비슷한 사고 재발 시 옛 회고 잊음. 기록 + 정기 review 필수.
자주 묻는 질문
Q. 사소한 사고 (한 멤버의 짧은 분쟁 등) 도 회고?
사소한 사고는 회고 안 해도 OK. 사고 회고 기준:
- 단톡방 신뢰 영향 (5+ 멤버 인지)
- 법적 / 정책 위험 (환불 / 분쟁 / 신고)
- 운영자 시간 부담 큼 (응답 후속 1시간+)
Q. 회고 시간이 너무 길어지면?
30분 알람 설정. 운영자 본인 정성 평가 부분은 별도 시간 (예: 일주일 후) 으로 분리.
Q. 다중 운영자 환경에서 사고 회고는?
운영자 회의에서 공유. 운영자 1명이 회고 작성 → 다른 운영자 검토 + 의견.
Q. 회고 템플릿을 자동화 가능?
부분 자동화. Replyer 의 Activity / Diagnostics 가 사고 사실 / 영향 데이터 자동 제공. 원인 / 재발 방지는 운영자 정성 분석.
Q. 사고 빈도가 높아지면?
운영자 한계 신호. 사고 빈도 월 5+ 면 단톡방 폐쇄 / 다중 운영자 / 단톡방 분할 검토. 운영자 혼자 운영 vs 다중 운영자 결정 트리 참고.
Q. 사고 회고 후 마음 부담이 큰데?
운영자 정서 영향은 자연. 운영자 본인 회고 별도 시간 + 휴식 / 자기 관리. 운영자의 본인 관리 참고.
다음 단계
본인 단톡방에 자동 답장을 도입하려면 Replyer 다운로드 에서 본인 OS 빌드를 받고, 단계별 사용법은 사용 매뉴얼 을 참고하세요.