본문 바로가기

전체 글157

rsync + SSH + cron으로 서버 간 특정 폴더 자동 백업 구축 rsync란?rsync는 리눅스/유닉스에서 가장 많이 쓰이는 파일 동기화 도구입니다. 특징증분 전송: 변경된 파일만 전송 → 네트워크 절약권한/시간 유지: -a 옵션으로 원본 그대로 복사압축 전송: -z 옵션 → 속도 향상삭제 동기화: --delete 옵션으로 원본과 동일하게 유지SSH 연동 가능: 원격 서버에도 안전하게 전송백업 자동화: cron과 결합하면 주기적 백업 가능 1. 작업 배경 두 대의 Linux 서버가 있고,한 서버에 있는 특정 폴더만 다른 서버로 주기적으로 백업해야 하는 상황 요구사항 정리 전체 복사 X → 변경된 파일만 전송자동화 필요한글 폴더명 포함안정적이고 표준적인 방식 2. SSH 키 생성 (기존 키와 별개로 백업용 키 발급)기존 SSH 키를 덮어쓰지 않기 위해 백업 전용 키를.. 2025. 12. 29.

ddd 1.1 데이터 서비스 API 활성화REST 인터페이스는 Observer Monitor Service에서 제공됩니다. REST 인터페이스를 사용하려면 Monitor 서비스가 설치, 시작, 그리고 구성되어 있어야 합니다.REST 서비스에 대한 설정은 Observer 프로그램 내에서 다음 경로에서 수행할 수 있습니다: Database > Options > Monitor Service > Phoenix Internal Web Service설정 방법Enabled 선택 REST 엔드포인트를 활성화하려면 Enabled 옵션을 선택합니다.인증 키 생성Generate Authentication Key 버튼을 클릭하여 영구 인증 키를 생성합니다.이 키는 인증 과정에서 디지털 서명을 생성하고, 권한 확인 시 디지털 서명을 .. 2025. 6. 13.

KISA BPFDoor 악성코드 점검 가이드 배포 관련 대응 BPFDoor 악성코드: 점검 가이드와 대응 방법 최근 SKT에서 발생한 대규모 개인정보 유출로 인해 . 이번 사건은 악성코드, 특히 BPFDoor라는 악성코드가 연루된 것으로 의심되고 있어 이에 대한 대응이 필요합니다.한국인터넷진흥원(KISA)의 BPFDoor 악성코드 점검 가이드를 바탕으로, 이 악성코드의 특징과 시스템 점검 방법을 자세히 정리한 포스팅입니다.BPFDoor 악성코드란?BPFDoor는 Berkeley Packet Filter(BPF)를 악용해 시스템에 침투하는 정교한 악성코드입니다. 이 악성코드는 주로 리눅스 시스템을 타겟으로 하며, 네트워크 트래픽을 조작하거나 백도어 역할을 수행해 공격자가 시스템에 지속적으로 접근할 수 있도록 합니다. SKT와 같은 대규모 통신사나 기업 네트워크가 이.. 2025. 5. 27.

TabNet Introduction TabNet은 2019년에 Google Research에서 발표한 딥러닝 기반의 트리 구조 모델로, 특히 Tabular Data 형태의 데이터에 최적화된 모델. TabNet은 Gradient-based Learning을 통해 최적화되며, 주요 특징으로 해석 가능성과 효율성을 들 수 있음 이름생년월일국어 점수영어 점수수학 점수홍길동1992년7월17일100점90점70점희동이1992년4월3일90점100점100점Tabular Data 예시 Tabular Data과 딥러닝은 다른 데이터 셋 ( Raw형 데이터 셋, 이미지, 영상 .. ) 과 비교하여 효과적인 성능을 보여주지 못하는 추세로, 비정형 데이터를 활용한 딥러닝을 사용하거나 feature engineering에 집중하여 머신 러닝.. 2024. 8. 4.

머신러닝 알고리즘 - KNN & SVM KNN KNN은 사례 기반 학습 중 하나로 별도의 모델 생성 없이 인접 데이터를 분류/예측하는데 사용할 수 있다.Lazy Learning : 모델을 미리 만들지 않고, 새로운 데이터가 들어오면 계산을 시작KNN, Native Bayes데이터로부터 모델을 생성하고 분류/예측하는 것은 Model-Based Learning 이라고 한다. K-Nearest Neighbors : K 개의 가까운 이웃을 찾고, 학습 데이터 중 K개의 가장 가까운 사례를 사용하여 분류 및 수치를 예측한다. 알고리즘 동작 방식새로운 데이터를 입력모든 데이터들과의 거리를 계산가장 가까운 K개의 데이터를 선택K개의 데이터의 클래스를 확인함다수의 클래스를 새로운 데이터의 클래스로 예측함 KNN에서는 알맞은 K를 선정하는 것이 KN.. 2024. 6. 21.

머신러닝 알고리즘 - Boosting Boosting 부트스트랩 샘플(무작위 표본 추출 시행)을 추출하는 과정에서 각 자료에 동일한 확률을 부여하는 것이 아니라 분류가 잘못된 데이터에 더 큰 가중을 주어 표본을 추출한다.약 분류기를 순차적으로 학습하는 앙상블 기법예측을 반복하면서 잘못 예측한 데이터에 가중치를 부여하여 오류를 개선 > Bagging : 무작위 복원 추출로 부트스랩 샘플을 추출함> Boosting : 부트스트랩 샘플을 추출하는 과정에서 각 자료의 동일한 확률을 부여하는 것이 아니라 분류가 잘못된 데이터에 더 큰 가중을 두어 표본을 추출함 Boosting의 종류AdaBoostGradient BoostXG Boost [1] AdaBoost ( Adaptive Boosting )간단한 약 분류기들이 상호보완하도록 순차적으로 학.. 2024. 6. 21.

[MQTT]Message Queueing Telemetry Transport Message Queueing Telemetry Transport [ MQTT ] [1] MQTT란?MQTT는 국제 표준화된 발행-구독(Publish-Subscribe) 기반의 메시지 송수신 프로토콜이다.MQTT는 국제 표준화된 표준 ISO/IEC PRF 20922 규격을 따름 (1-1) 메시지 송수신 프로토콜이란?- 프로토콜: 컴퓨터나 장치들이 서로 통신할 때 어떤 설정과 규칙을 따르는지 정립 해놓은 것[ (ex) 우편 시스템 : 편지를 어떻게 쓰고, 주소를 어떻게 적고 우표를 어디에 붙이는지에 대한 규칙도 일종의 송수신 프로토콜의 예시로 볼 수 있다. ] - MQTT는 발행-구독(Publish-Subscribe) 기반의 송수신 프로토콜이다.발행-구독(Publish-Subscribe) 방식은 정보를.. 2024. 5. 31.

[NestJs] Controller NestJSNest(NestJS)는 효율적이고 확장 가능한 Node.js 서버 측 애플리케이션을 구축하기 위한 프레임워크입니다 . 특징프로그레시브 JavaScript를 사용하고 TypeScript 로 구축되어 완벽하게 지원OOP(객체 지향 프로그래밍), FP(기능 프로그래밍) 및 FRP(기능 반응 프로그래밍) 요소를 결합내부적으로 Nest는 Express (기본값)와 같은 강력한 HTTP 서버 프레임워크를 사용하며 선택적으로 Fastify 도 사용하도록 구성할 수 있습니다!Nest는 이러한 일반적인 Node.js 프레임워크(Express/Fastify)보다 높은 수준의 추상화를 제공하지만 해당 API를 개발자에게 직접 공개이를 통해 개발자는 기본 플랫폼에서 사용할 수 있는 수많은 타사 모듈을 자유롭게 사.. 2024. 4. 26.

[ Spark ] Spark란 무엇인가 기존 MapReduced의 문제점 기존 MapReduce 에서의 문제점 데이터 복제, 디스크 I/O, 직렬화로 인한 오버헤드 발생 디스크와 메모리 간의 지속적인 데이터 전송으로 인한 트래픽 발생 오버에드 및 대량의 트래픽으로 인한 프로그래밍이 어려워짐 성능 병목 및 패치 문제 발생 가능성 증가 디스크 지속성이 메모리 작업에 비해 느려 성능 악화 Data-Flow Systems Data-flow 시스템이란 기존의 데이터 시스템과 달리, 데이터 처리를 단계적인 흐름으로 관리하는 시스템 기존에는 MapDeduce는 2가지의 등급별로 작업을 진행함 One for Map , the Second for Reduce Flow -> 직렬화가 문제가 되는 경우 발생 (병목 등의 현상) Dta-Flow Systems의 일.. 2024. 4. 21.

[ Spark ] 빅데이터의 분산 처리와 Map Reduce Data Mining : 대규모 데이터셋에서 패턴, 규칙, 트랜드 등의 유용한 정보를 추출하기 위해 사용되는 과정 지식을 추출하기 위해 데이터는 저장, 관리, 그리고 분석이 수행되어야 함 → 데이터 마이닝의 필요성 데이터 마이닝 ≈ 예측 분석 ≈ 데이터 과학 ≈ 머신 러닝 ≈ 데이터 중심 AI 매우 큰 데이터셋에서 의미 있는 정보를 추출하는 것이 어렵기 때문에 현재 관심받는 연구 분야 주로 확장가능한 알고리즘에 중점을 두는데, 이 때 병렬처리가 필수적으로 요구됨 Descriptive methods ▪ 데이터를 설명하는 사람이 해석할 수 있는 패턴 찾기 ▪ 예: 클러스터링 Predictive methods ▪ 일부 변수를 사용하여 다른 변수의 알려지지 않은 값 또는 미래 값 예측 ▪ 예: 추천 시스템 데이.. 2024. 4. 20.

머신러닝 알고리즘 - Naive Bayes Naive Bayes 나이브 베이즈(Naive Bayes)는 베이즈 정리를 기반으로 하는 확률적 분류 알고리즘 중 하나입니다. 주로 텍스트 분류, 스팸 필터링, 감성 분석 등의 문제에 많이 사용됩니다. 이름에 "Naive(순진한)"라는 말이 붙은 이유는 모든 특성이 독립이라고 가정하기 때문입니다. 확률 (Probability)확률은 어떤 사건이 발생할 가능성을 나타내는 수치입니다. 일반적으로 0부터 1까지의 값을 가지며, 0은 사건이 발생하지 않을 확률이고, 1은 사건이 반드시 발생할 확률을 의미합니다. 확률은 주어진 상황에서 특정 사건이 일어날 가능성을 수학적으로 표현하는 데 사용됩니다. 조건부확률 (Conditional Probability) 조건부확률은 어떤 사건이 특정 조건 아래에서 일어날 확률.. 2023. 12. 29.

머신러닝 알고리즘 - Logistic Regression Logistic Regression [ 비 선형 회귀 ] Linear Regression은 연속형 변수 예를 들어, 주택 가격이나 온도와 같은 연속적인 값을 예측하는데 사용되었다면 Logistic Regression은 불연속적인 데이터 주로 이진 분류 문제에 사용된다. 이진 분류 문제 ? 주어진 입력 변수에 대해 두 개의 클래스 중 하나에 속할 확률을 예측하는 것을 목표로 한다. 예를 들어, 이메일이 스팸인지 아닌지를 예측하는 데 사용된다. 범주형 데이터와 선형 회귀 단순 선형 회귀의 예측 범위가 -inf ~ inf 에 반해 범주형 데이터인 경우 정답의 범위가 0과 1사이 0과 1사이를 벗어나는 예측은 예측의 정확도를 낮추게함 따라서 예측의 결과가 0과 1사이에 위치해야 함 Logistic Regress.. 2023. 12. 18.

이전 1 2 3 4 ··· 14 다음

티스토리툴바