초반부터 강하게 - Verkada로부터 얻은 교훈이 Serval의 AI 에이전트에 미친 영향

1분기 스프린트에서 Serval의 AI 에이전트를 핵심 IT 플랫폼 전반에 집중적으로 조기 출시하여 속도를 높이고 반복적인 작업을 줄입니다. 이 접근 방식은 조기에 명확한 성과를 달성하고, 관리자에게 알림에 대한 전체적인 보기를 제공하며, 추진력을 높이는 공유된 리듬을 설정합니다. 팀의 경우 명확한 소유 구조는 조정을 가속화하고 보안, 운영 및 헬프데스크 간의 마찰을 줄입니다.

Verkada의 규모와 IT 운영에 미치는 영향에서 흥미로운 점은 팀 간의 시너지와 운영자가 사고보다 앞서 나갈 수 있도록 하는 긴밀한 신호 패널입니다. 이를 IT 워크플로에 적용해 보세요. 즉, 데이터를 명확하게 정의된 소유권과 첫날부터 관리자가 신뢰할 수 있는 안정적인 자동화 기능을 갖춘 패널을 활용하는 것입니다.

초기 테스트를 통해 Serval은 반복적인 알림을 예측 가능한 워크플로로 전환하여 패턴을 신속하게 구체화하는 방법을 배웠습니다. 몇 주 안에 에이전트는 루틴 분류를 처리하기 시작하여 관리자가 전략적 업무에 집중할 수 있도록 합니다. 결과는 사고 대응에 대한 완전한 통제와 팀 전반의 실질적인 추진력입니다.

앞으로 첫 번째 고가치 자동화 물결을 구현하기 위해 소규모의 교차 기능 팀을 구성할 것입니다. 안정적인 결과를 중요하게 생각하는 플랫폼 엔지니어, 데이터 과학자 및 IT 관리자를 참여시키는 것이 필수적입니다. 이렇게 하면 강력한 모멘텀이 생성되고 부서 전체에 확장할 수 있는 명확한 수단이 마련됩니다.

다음 단계는 무엇입니까? 속도, 채택률 및 에이전트 패널의 처리량을 모니터링합니다. 데이터를 보면 학습된 정책이 구체화되고 반복 가능해지는 것을 볼 수 있으며, 이는 팀이 수동 처리에서 사전 예방 계획으로 전환하고 있음을 나타냅니다.

초기부터 강력하게: Verkada의 교훈이 IT 팀을 위한 Serval의 AI 에이전트를 형성했습니다 – Jake Stauch, 설립자 겸 CEO

IT 운영에서 Serval AI 에이전트의 14일 파일럿을 시작하고 3~5개의 핵심 팀에 배포하며 시작 시 성공 지표를 정의합니다. Stauch는 2주 스프린트를 강력히 권장합니다. 즉, 배포, 측정 및 반복하며 며칠 안에 MTTR, 알림 노이즈 및 자동화 적용 범위의 측정 가능한 개선을 레이더 아래로 가져오는 것을 목표로 합니다. 2주차 말까지 평균 수리 시간 20~30% 감소와 에스컬레이션 15% 감소를 기대할 수 있습니다. 에이전트가 지식 기반 및 인간 운영자로부터 답변을 가져올 수 있도록 하는 대화 중심 설정을 사용하면 자동화된 조치에 대한 자신감을 높일 수 있습니다. 이는 데이터 품질과 안전 장치에 대한 강력한 베팅이 안정적인 기준선을 설정하는 Verkada의 접근 방식을 반영합니다. 사고 분류, 비밀번호 재설정 및 자산 검색으로 시작한 다음, 배포된 에이전트 결과가 수동 단계를 얼마나 자주 대체하는지 추적합니다. 아래에서는 실제로 중요한 조기 배포에서 가장 명확한 안전 장치를 찾을 수 있습니다.

Verkada의 플레이북에서 교훈은 올바른 베팅에 빠르게 움직이고 거버넌스를 조기에 확보하는 것입니다. Verkada는 드리프트를 줄이는 구체화된 데이터 모델과 신뢰도 점수를 표시하고 데이터가 모호할 때 명확화를 요청하는 대화 계층을 구축했습니다. 보안, IT 및 제품 전반에 걸쳐 내부 대화 루프를 통합하여 결과가 운영자 본능과 일치할 때까지 프롬프트를 개선했습니다. 또한 Facebook 규모의 원격 측정 기능을 활용하여 팀을 압도하지 않고 알림이 확장되도록 임계값을 조정했습니다. 내부 메모에서 "serval" 및 "servals"라는 용어는 경량 에이전트 인스턴스의 약어로 사용되어 필요에 따라 성장하는 빠르고 반복 가능한 배포를 추진하는 것을 강조합니다.

Serval이 오늘날 성장하려면 자금을 실용적인 로드맵과 일치시켜야 합니다. 여러 차례의 자금 조달 및 다수의 투자자와의 논의가 진행 중이며 올해 여러 차례의 라운드를 완료할 계획입니다. 벤치마킹, 모델 학습 및 현장 배포에 자금을 할당하고 기존 ITSM 도구에 통합되는 빌드를 설계합니다. 목표는 60일 이내에 운영 준비가 된 파이프라인을 구축하고 분기별로 2~3개의 새 팀으로 확장하는 것입니다. 팀은 이미 초기 통합 작업을 시작했으며 환경 전반에 걸쳐 배포된 자산 및 거버넌스 검사를 가속화하기 위한 구체적인 마일스토리를 개략적으로 설명했습니다.

이제 IT 팀을 위한 구현 단계: 시작 계획, 범위 정의 및 처리 정책 설정 – AI 제안은 첫 번째 단계로 유지하고 조치 전에 인간 검토를 거칩니다. 팀 간의 조정을 위한 챔피언을 임명합니다. 사고, 알림 및 자산에서 데이터를 수집합니다. 개인 정보 보호 및 액세스 제어를 보장합니다. 명확한 성공 기준과 프롬프트를 조정하기 위한 피드백 루프를 설정합니다. 실제 대화를 듣고 격차를 파악하는 질문을 하여 운영자의 요구 사항을 이해합니다. 드리프트를 피하기 위해 매우 간단한 프롬프트를 유지하면서 추가 검증 단계부터 시작합니다. 배포가 견고한 이점을 보이면 다음 분기에 확장합니다. 그렇지 않으면 Serval과 데이터 소스를 반복하여 결과를 개선하고 모델을 인간 에이전트와의 신뢰할 수 있는 대화로 가져옵니다. 목표는 구체적인 승리로 시작하고 과도한 확장을 피하여 IT 복원력을 위한 각 단계가 중요하도록 보장하는 것입니다.

Verkada의 보안 우선 사고방식을 구체적인 에이전트 동작으로 변환

플랫폼 정책 엔진에 코드를 작성할 보안 우선 플레이북으로 시작합니다. 모든 작업에 대해 MFA, 최소 권한 및 짧은 수명 토큰을 요구합니다. 위험 검사에 실패하는 작업을 거부합니다. 모든 작업을 변조 방지 저장소에 기록하고 매주 검토하여 임계값을 개선합니다. 이는 드리프트가 데이터를 손상시키는 것을 방지하는 강력한 제약 조건입니다.

이러한 구체적인 에이전트 동작은 Verkada의 정신에서 구체화되었습니다. 데이터 풀링 전에 에이전트는 ID와 컨텍스트를 검증합니다. 검사에 통과하면 진행하고, 그렇지 않으면 보안 경고를 발생시키고 중지합니다. 에이전트는 위험 임계값을 보정하기 위한 확률적 기준선을 유지하고 시간이 지남에 따라 적응하기 위해 시드 값 접근 방식을 사용합니다. 그런 다음 단계를 IT 우선 순위 및 고객에 대한 가치 제공에 대한 로드맵과 일치시킵니다.

이 접근 방식으로 시작하려면 파트너 정신이 필요하므로 IT 팀과 협력하여 통제된 롤아웃을 준비할 수 있는 규모로 배포합니다. 그들은 속도와 비밀번호 관리 규율 및 주기적인 액세스 검토의 균형을 맞추고 있습니다.

동작	트리거	구현	지표
ID 확인 액세스	컨텍스트 일치 데이터 액세스 요청	MFA/SSO 적용, 짧은 수명 토큰, 코드 게이트로서의 정책, 구조화된 로그	인증 실패율, 승인 시간
최소 권한 자동 적용	정책 불일치 또는 과도한 권한 요청	자동 범위 제한, 범위를 벗어났을 때 취소, 필요한 경우 인간에게 에스컬레이션	권한 에스컬레이션 이벤트, 취소 시간
작업 수준 감사 로깅	모든 에이전트 작업	불변 저장소에 구조화된 로그, 행위자, 시간, 처리된 데이터, 결과	로그 적용 범위, 감사 실패율
이상 징후 격리	위험 점수 급증 또는 비정상적인 패턴	격리 모드, 읽기 전용, 인간에게 알림, 안전한 복구 허용	격리 시간, 격리 이벤트
롤백 및 복구 경로	수정 실패	미리 구축된 롤백 스크립트, 스냅샷 기반 복구	롤백 성공률, 복구 평균 시간

실시간 분류 규칙을 설계하여 사고 대응 시간 단축

도착 후 60초 이내에 알림을 분류하고 야간 포함 교대 근무별로 올바른 담당 에이전트에게 라우팅하는 실시간 분류 규칙 엔진을 구현합니다.

규칙 1: 인증 또는 비밀번호 시도에서 알림이 발생하고 동일한 사용자 또는 IP에서 실패가 급증하는 경우 보안 운영 에이전트로 에스컬레이션하고 정책이 허용하면 계정을 자동으로 잠급니다.

규칙 2: 5분 이내에 동일한 자산에 일련의 관련 알림이 도달하면 로그, 추적 및 메트릭에 걸쳐 공유 세션을 관리할 담당 에이전트에게 라우팅합니다.

규칙 3: 기존 제품의 비 중요 문제는 AI 기반 분류를 사용하여 경량 실행 서적을 참조한 후 담당자 명단 후보 중 한 명에게 할당합니다. 이 프로세스는 채용 결정에 영향을 미치고 해당되는 경우 비밀번호 재설정 또는 정책 검사를 포함합니다.

초기 배포에서 Jake와 그의 벤처 기업은 실시간 분류에 대해 많은 것을 배웠습니다. 그의 팀은 지속적인 개선을 강조했으며 야간 근무 최적화 및 AI 기반 분류를 채택하는 회사를 위한 관리 보고서를 포함하여 다음 반복을 발표했습니다.

AI 데이터 흐름에 대한 데이터 거버넌스 및 개인 정보 보호 제어 매핑

정책 기반 거버넌스 모델에 AI 데이터 흐름을 매핑하고 각 데이터 슬라이스에 대한 소유자를 지정하는 것으로 시작합니다. 이 작업을 시작할 때 범위 내 데이터(소스, 변환, 대상 및 보존 지점)를 정의하고 각 단계를 개인 정보 보호 제어에 연결합니다. 데이터가 이동할 때 PII, 민감한 속성 및 동의 신호에 주의하십시오. 팀이 신속하게 조치를 취할 수 있도록 데이터 슬라이스의 소유권을 맡습니다. 보안, 개인 정보 보호 및 제품 팀이 협력하여 위험 격차를 해소합니다. 이러한 가시성은 데이터 계보를 통합하고 모델이 민감한 입력에 액세스하기 전에 위험을 제어합니다. 정책과 일치하기 위해 매주 진행 상황을 검토합니다.

최소 권한 액세스, 역할 기반 권한, MFA 및 자격 증명 로테이션을 구현합니다. 각 세션을 감사 가능하게 취급합니다. 비밀번호 정책을 엄격하게 유지하고 자격 증명을 하드코딩하지 마십시오. 권한 변경에 대한 티켓을 만들고 명확한 근거와 예상되는 개인 정보 보호 영향을 첨부합니다. 이는 원활한 운영을 지원하고 변경 사항을 추적 가능하게 만듭니다.

코드로서의 정책, 자동화된 마스킹 및 데이터 손실 방지 규칙으로 개인 정보 보호 제어를 자동화합니다. 이렇게 하면 데이터 흐름 전반에 걸쳐 복원력이 추가되고 수동으로 확인하는 데 필요한 노력이 줄어듭니다. 이는 수동 확인에 의존하지 않습니다. 자동화는 지속적인 테스트를 실행합니다. 데이터가 모델을 통과할 때 확인합니다. 데이터가 전송 중 및 저장 시 암호화되어 있습니까? 보존 타이머가 시행됩니까? 확인에 실패하면 흐름을 차단하고 수정을 위해 티켓을 발생시킵니다.

내부 앱 및 외부 커넥터 전반에 걸쳐 AI 데이터 흐름을 개인 정보 보호 제어에 매핑합니다. 다른 통합을 배포하거나 facebook과 같은 플랫폼에 연결하는 경우 데이터가 익명화되거나 토큰화되었는지 확인하고 원시 식별자를 보내지 마십시오. 모든 외부 연결에 대한 데이터 출처를 기록하고 정책 드리프트를 모니터링하여 팀 간의 노출을 방지합니다.

Stauch의 프레임워크는 거버넌스를 일상적인 운영과 통합하는 방법을 보여줍니다. 주간 일정은 교훈으로 시작합니다. 즉, 소유자를 확보하고 상태 기반 정책을 게시하며 테스트 데이터로 검증하는 것입니다. 세션 기반 액세스 정책을 설정하고 채용 과정에서 개인 정보 보호 교육이 온보딩의 일부인지 확인합니다. 예외가 발생하면 티켓으로 기록하고 다음 반복에서 자동화된 수정 사항을 구현합니다. 이 대안은 속도를 유지하면서 제어를 보존합니다. 비즈니스에서 이러한 단계는 복원력을 더하고 팀이 책임감 있게 확장할 수 있는 시간을 제공합니다.

요약: 데이터 맵으로 시작하여 각 핸드오프에서 제어를 강화하고 정책 시행을 자동화하여 수동 오버헤드를 줄였습니다. 함께 IT 및 비즈니스가 AI 에이전트가 작업을 확장하고 원활하게 티켓을 처리할 때 의존할 수 있는 데이터 거버넌스 패브릭을 구축합니다.

결과 중심 지표 설정으로 IT 운영에 대한 에이전트 영향 정량화

단일 기본 결과를 정의하고 모든 지표를 이에 고정합니다. 즉, 지능형 Serval의 AI 에이전트가 티켓팅, 분류 및 가능한 경우 자동화된 해결을 처리하여 30일 이내에 P1 사고 MTTR을 40% 줄입니다. 이를 매일 추적합니다. 팀이 정렬되고 책임지도록 간결한 요약으로 매주 검토합니다. 팀 전반에 걸쳐 MTTR 감소 및 처리량 증가로 그들의 영향을 측정할 수 있습니다.

주요 결과 및 목표

정의: 첫 티켓부터 복구까지 P1 사고 해결 평균 시간.
목표: 30일 이내에 40% 감소.
데이터 소스: 티켓 시스템, 사고 원장 및 에이전트 로그.
주기: 일일 추적, 주간 요약, 월간 추세선.
중요성: 자동화와 인간의 노력이 변화를 가져오는 곳에 주목하게 만듭니다.

에이전트 영향을 정량화하기 위한 운영 지표

자동화율: 지능형 Serval에 의해 완전히 또는 부분적으로 처리된 티켓 비율; 60일 이내에 60% 목표.
폴백율: 인간 에이전트에게 에스컬레이션된 상호 작용 비율; 인간이 복잡한 사례에 집중하도록 < 15% 목표.
첫 응답 시간(TTFR) 개선: 배포 전후 TTFR 비교; 첫 연락 시 30% 더 빠름 목표.
티켓 처리량: 일일 마감 티켓 수; 점진적인 20% 상승 목표.
재오픈 티켓: 해결 후 비율; < 5% 목표.

품질 신호 및 학습 신호

복잡성: 대화 전사본에 대한 언어 모델 복잡성 모니터링; 명확성 유지를 위해 안정적이거나 감소하는 추세 목표.
신뢰도: 봇 결정에 대한 평균 신뢰도 점수; 자동화된 해결의 경우 0.8 이상 목표.
대화 길이 및 턴: 효율성 모니터링; 간결하면서도 완전한 상호 작용 목표.
학습된 조정: 개선을 가져오는 기술 변경 기록; 구체화된 플레이북에 포함.

비즈니스 영향 및 위험 신호

회피된 다운타임: 시간당 방지된 중단 시간; 주당 2시간 미만 목표.
CSAT 및 사용자 피드백: 순 점수 개선 목표; 티켓 상호 작용에서 감정 추적.
하드웨어 및 컴퓨팅 효율성: 리소스 사용량 모니터링; 봇 작업량이 하드웨어 제한 내에 있는지 확인.

배포 주기 및 거버넌스

배포: 성공적인 파일럿 후 다른 팀에 롤아웃; 데이터가 위험 신호를 나타내지 않는 한 위험 회피 접근 방식을 사용하고 즉시 조정합니다.
평가: 2주 파일럿 실행 후 확장; 학습을 구체화하고 조정을 계획하기 위해 주간 에피소드 요약을 유지합니다.
주목 및 시장 맥락: 상대적 성능을 측정하기 위해 시장 경쟁사와 벤치마킹하고 시장이 변하면 목표 조정.

마지막으로, 긴밀한 피드백 루프를 유지합니다. Alex와 팀은 에피소드 요약을 검토하고 Serval이 데이터에서 학습했는지 확인하며 그에 따라 프롬프트와 데이터 소스를 조정합니다. 복잡성 또는 신뢰도 신호가 예기치 않게 변경되면 기술을 반복하고 업데이트된 프롬프트를 배포합니다. 측정 결과가 위험을 나타내지 않는 한 주간 추적을 비즈니스 요구에 맞춰 주기를 계속합니다. 데이터가 구체화됨에 따라 흥미로운 패턴이 나타나고 팀은 다음 개선 에피소드에서 반복할 가치가 있는 것을 발견합니다.

실용적인 배포 플레이북 만들기: Serval을 ITSM, SIEM 및 모니터링과 통합

초기에는 3단계 배포로 시작합니다. Serval을 ITSM, SIEM 및 모니터링과 통합하여 분류, 수정 및 감사 추적을 자동화합니다. 이 설정은 사고 처리를 가속화하고 IT 운영 및 보안을 위한 단일 진실 공급원을 만듭니다. 처음에는 범위를 좁게 유지합니다. 즉, 3개의 커넥터, 공유 사고 모델 및 경량 수정 실행 서적입니다.

데이터 계약 정의: Serval은 ITSM(티켓 ID, 우선 순위, 담당자)에서 티켓 데이터를 읽고, SIEM 이벤트를 컨텍스트(사용자, 호스트, IP)로 보강하고, 사고 업데이트 및 작업 노트를 다시 작성합니다. 필드를 명확하게 매핑하고 민감한 값을 저장할 위치를 결정하며 일반 저장소 대신 암호 저장소를 사용합니다. 고객의 요구 사항 및 규정 준수 요구 사항과 일치하는 개인 정보 보호 및 보존 정책을 설정합니다.

커넥터 및 데이터 흐름 구축: ServiceNow 또는 선택한 ITSM을 구성하고 SIEM(Splunk, QRadar 등)을 선택하고 모니터링 스택(Prometheus/Grafana 또는 클라우드 기반 동급)을 연결합니다. Serval이 이벤트를 티켓에 중복 없이 연결할 수 있도록 시스템 전체에서 고유하고 지속적인 ID를 사용합니다. 누락된 알림을 방지하기 위해 여러 알림 채널(Slack, 이메일 및 네이티브 티켓)을 설정합니다.

강화 규칙 및 자동화: 모든 알림에 컨텍스트를 첨부하고 위험별로 분류하며 SLA가 위험에 처했을 때 에스컬레이션하는 규칙 세트를 구현합니다. 반복적인 작업을 실행 서적으로 전환하여 단일 트리거에서 실행되도록 하여 반복적인 작업을 무의미하게 만듭니다. 티켓을 생성하거나 업데이트하고, 보안 관리자를 통해 비밀번호 로테이션을 실행하고, 수정 결과를 SIEM으로 업데이트하는 자동화를 구축합니다.

플레이북 예: 자격 증명 노출. SIEM에서 자격 증명 알림이 도착하면 Serval은 우선 순위가 높은 ITSM 티켓을 열고 지난 30일간의 로그인 이벤트를 가져와 의심스러운 액세스를 확인하고 비밀번호 로테이션을 보안 관리자를 통해 트리거합니다. 로테이션이 완료되면 증거 및 메모가 연결된 티켓을 닫습니다. 이 접근 방식은 격리를 가속화하고 고객 및 내부 팀의 수동 단계를 줄입니다.

플레이북 예: 공급망 알림. 공급업체 알림이 나타나면 Serval은 자산 인벤토리와 상관 관계를 분석하고 티켓을 발생시키며 상위 팀에 알립니다. 워크플로는 신속한 대응을 수행하고 반복적인 수동 검사를 줄이며 수정 지연 없이 중요 서비스를 보호합니다.

모니터링 및 대시보드: 주요 지표(평균 승인 시간(MTTA), 평균 탐지 시간(MTTD), MTTR, 자동화 적용 범위 및 오탐율)를 표시합니다. ITSM 상태, SIEM 컨텍스트 및 모니터링 신호를 결합한 단일 창으로 완전한 그림을 구축합니다. 주간 검토 및 월간 계획 세션을 위한 스냅샷을 생성합니다.

거버넌스 및 보안: 최소 권한 API 키를 사용하고, 자격 증명을 정기적으로 로테이션하고, Serval, ITSM 및 SIEM 전반에 걸쳐 액세스 제어를 적용합니다. 암호를 전용 볼트에 저장하고 모든 변경 사항을 감사합니다. 로드맵 및 일반 보안 상태와 일치시킵니다. 설립 초기 협상 및 인터뷰에서 Jake는 강력한 거버넌스가 고객 간의 속도와 신뢰를 배가한다고 강조했습니다. Ber kata의 업계 소식통은 기술 용어 및 관련 팟캐스트를 포함하여 해당 접근 방식을 강화합니다.

로드맵 및 준비 상태: 고객을 포함한 이해 관계자와 분기별 계획을 예약하여 목표 대비 결과를 검증합니다. 설립 팀 및 접근 방식을 강조한 인터뷰 및 팟캐스트의 피드백을 초대합니다. 해당 피드백은 계획을 형성하고 플레이북이 변화하는 위협과 운영 요구 사항보다 앞서 나가도록 하여 Jake와 팀이 많은 경쟁자보다 강력하고 빠른 배포를 추진하는 데 사용했습니다.

이것이 바로 이 플레이북이 구체적인 조치, 측정 가능한 결과 및 고객과의 피드백 루프에 중점을 두는 이유입니다. 여러 팀이 워크플로를 채택함에 따라 더 빠른 격리, 명확한 소유권 및 계획에서 실행까지 확장 가능한 경로를 찾을 것입니다.