
ଆମେ ସମସ୍ତେ ଡାଟା ତିଆରି କରୁଛୁ! AWS Clean Rooms ରେ ନୂଆ ଜାଦୁ: Incrementally ଓ Distributed Training!
ଆଜି, ୨୦୨୫ ଜୁଲାଇ ୧ ତାରିଖରେ, 21:55 ରେ, Amazon ଠାରୁ ଏକ ବଡ ଖବର ଆସିଛି! ସେମାନେ AWS Clean Rooms ରେ ଦୁଇଟି ନୂଆ, ବହୁତ ମଜାଦାର ଜିନିଷ ଯୋଡିଛନ୍ତି: Incremental Training ଏବଂ Distributed Training। ଏହା ଆମକୁ କଷ୍ଟମ ମଡେଲ ତିଆରି କରିବାରେ ବହୁତ ସାହାଯ୍ୟ କରିବ।
ଏହା କ’ଣ ଜାଣିବା ପୂର୍ବରୁ, ଆମେ କିଛି ଜରୁରୀ କଥା ଜାଣିବା।
ତୁମେ ଜାଣିଛ, ଆମେ ସମସ୍ତେ ଦୈନିକ ବହୁତ ଡାଟା ତିଆରି କରୁ। ତୁମେ ଯେତେବେଳେ କୌଣସି ଗପ ପଢ଼, କୌଣସି ଗୀତ ଶୁଣ, କିମ୍ବା କୌଣସି ଖେଳ ଖେଳ, ତୁମେ ଡାଟା ତିଆରି କରୁଛ। ଏହି ଡାଟା ବହୁତ ମୂଲ୍ୟବାନ। ଏହାକୁ ବ୍ୟବହାର କରି ଆମେ କମ୍ପ୍ୟୁଟରକୁ ବୁଦ୍ଧିମାନ କରିପାରୁ। ଏହାକୁ “ମେସିନ ଲର୍ଣ୍ଣିଙ୍ଗ” କୁହାଯାଏ।
ମେସିନ ଲର୍ଣ୍ଣିଙ୍ଗରେ, ଆମେ ଏକ “ମଡେଲ” ତିଆରି କରୁ। ଏହି ମଡେଲ କମ୍ପ୍ୟୁଟରକୁ ନୂଆ ଜିନିଷ ଶିଖିବାକୁ ସାହାଯ୍ୟ କରେ। ଉଦାହରଣ ସ୍ୱରୂପ, ଆମେ କମ୍ପ୍ୟୁଟରକୁ ଶିଖାଇପାରୁ ଯେ କେଉଁଟା କୁକୁର ଓ କେଉଁଟା ବିଲେଇ। ଏଥିପାଇଁ ଆମକୁ ବହୁତ କୁକୁର ଓ ବିଲେଇର ଫଟୋ ଦେଖାଇବାକୁ ପଡିବ।
AWS Clean Rooms କ’ଣ?
AWS Clean Rooms ହେଉଛି ଏକ ସୁରକ୍ଷିତ ସ୍ଥାନ ଯେଉଁଠାରେ ଆମେ ଆମର ମୂଲ୍ୟବାନ ଡାଟାକୁ ନେଇ କାମ କରିପାରୁ। ଏହାକୁ ତୁମର ଖେଳଣା ବାକ୍ସ ଭଳି ଭାବ। ତୁମେ ତୁମର ଖେଳଣା ଗୁଡିକୁ ନଷ୍ଟ ନକରି ବହୁତ କିଛି କରିପାର। AWS Clean Rooms ରେ, ଆମେ ଆମ ଡାଟାକୁ ନେଇ ଥିଏରି ତିଆରି କରିପାରୁ, ଯାହା ଆମର ଡାଟାକୁ କେହି ଦେଖି ନପାରିବ।
ଏବେ ନୂଆ କଣ?
1. Incremental Training (ଅନୁକ୍ରମିକ ପ୍ରଶିକ୍ଷଣ):
ଏହା କ’ଣ କହିବା ପାଇଁ, ତୁମେ କଣ କରୁଛ ବୋଲି ଭାବ। ତୁମେ ଗୋଟିଏ ନୂଆ ଭାଷା ଶିଖୁଛ। ପ୍ରଥମେ ତୁମେ କେବଳ କେତେକ ଶବ୍ଦ ଶିଖିବ। ତାପରେ ଧୀରେ ଧୀରେ ତୁମେ ବେସି ଶବ୍ଦ ଶିଖିବ ଓ ତାଙ୍କର ଅର୍ଥ ବୁଝିବ। ଏହିଭଳି, ଆମେ ଡାଟା ମଧ୍ୟ ମଡେଲକୁ କିଛି କିଛି କିଛି ଶିଖାଇବା।
Incremental Training ଏହାରି ଭଳି। ଆମେ ମଡେଲକୁ ଥରେ ସବୁ ଡାଟା ଦେବା ନାହିଁ। ବରଂ ଆମେ ଏହାକୁ ଡାଟାର ଗୋଟିଏ ଛୋଟ ଭାଗ ଦେବୁ, ତାପରେ ଆଉ ଗୋଟିଏ ଛୋଟ ଭାଗ, ଏହିଭଳି କରି ମଡେଲକୁ ଧୀରେ ଧୀରେ ଶିଖାଇବୁ। ଏହା ଡାଟା ସବୁବେଳେ ନୂଆ ରହିବ ଏବଂ ମଡେଲକୁ ମଧ୍ୟ ନୂଆ ଜିନିଷ ଶିଖିବ। ତୁମେ ଯେମିତି ପୁରୁଣା ଶିଖା ହୋଇଥିବା ଜିନିଷ ଗୁଡିକୁ ମନେ ରଖି ନୂଆ ଜିନିଷ ଶିଖୁଛ, ଏହା ମଧ୍ୟ ସେହିଭଳି କାମ କରେ।
ଏହାର ଫାଇଦା କ’ଣ?
- ଡାଟା ଅଧିକ ବ୍ୟବହାର କରିହେବ: ତୁମ ପାଖରେ ବହୁତ ଡାଟା ଥିଲେ, ତାକୁ ଥରେରେ ଦେବା କଷ୍ଟ ହୋଇପାରେ। Incremental Training ରେ ଆମେ ଡାଟାକୁ ଛୋଟ ଛୋଟ ଭାଗ କରି ଦେଇପାରୁ।
- ମଡେଲ ସବୁବେଳେ ଅପଡେଟ୍ ରହିବ: ଯେତେବେଳେ ନୂଆ ଡାଟା ଆସିବ, ଆମେ ତାକୁ ମଡେଲକୁ ସହଜରେ ଦେଇପାରୁ, ଯାହା ଦ୍ୱାରା ମଡେଲ ସବୁବେଳେ ନୂଆ ଜିନିଷ ଶିଖିବ।
2. Distributed Training (ବିତରଣ ପ୍ରଶିକ୍ଷଣ):
ତୁମେ କେବେ ଘର କାମ ଏକା କରୁଛ ଯେତେବେଳେ ତୁମ ପାଖରେ ବହୁତ କାମ ଥାଏ? ଏହା ବହୁତ କଷ୍ଟକର। କିନ୍ତୁ ଯଦି ତୁମର ସାଙ୍ଗମାନେ ତୁମକୁ ସାହାଯ୍ୟ କରନ୍ତି, ତାହା ବହୁତ ସହଜ ହୋଇଯାଏ, ଠିକ ନୁହେଁ?
Distributed Training ମଧ୍ୟ ସେହିଭଳି। ଆମେ ଯେତେବେଳେ ବହୁତ ବଡ ଡାଟା ସେଟ୍ ନେଇ କାମ କରୁ, ଏହା ବହୁତ କଷ୍ଟକର ହୋଇପାରେ। Distributed Training ରେ, ଆମେ ମଡେଲକୁ ଏକାବେଳେ ଗୋଟିଏ କମ୍ପ୍ୟୁଟରରେ ତିଆରି ନକରି, ଅନେକ କମ୍ପ୍ୟୁଟରକୁ ଏକା ସାଙ୍ଗରେ କାମ କରାଇବୁ। ଏହା ଠିକ ତୁମର ସାଙ୍ଗମାନେ ତୁମକୁ ସାହାଯ୍ୟ କରିବା ଭଳି। ଏହା କାମକୁ ବହୁତ ସହଜ ଓ ଶୀଘ୍ର କରିଦେବ।
ଏହାର ଫାଇଦା କ’ଣ?
- କାମ ଶୀଘ୍ର ହେବ: ଯେହେତୁ ଅନେକ କମ୍ପ୍ୟୁଟର ଏକା ସାଙ୍ଗରେ କାମ କରୁଛି, ତେଣୁ କାମ ବହୁତ ଶୀଘ୍ର ହୋଇଯିବ।
- ବଡ ଡାଟା ସହ କାମ କରିହେବ: ଯେଉଁ ଡାଟା ଗୋଟିଏ କମ୍ପ୍ୟୁଟରରେ ସମ୍ଭବ ନୁହେଁ, ତାକୁ ଅନେକ କମ୍ପ୍ୟୁଟର ମିଶି କରିପାରିବେ।
ଏହା କେମିତି ବିଜ୍ଞାନରେ ଆଗ୍ରହ ବଢାଇବ?
ଏହି ନୂଆ ଜିନିଷ ଗୁଡିକ ପିଲା ଓ ଛାତ୍ର ମାନଙ୍କୁ ନୂଆ ଓ ଆଗ୍ରହୀ କରିବ। ଯେତେବେଳେ ଆମେ ମଡେଲ ତିଆରି କରିବୁ, ତାହା ଆମକୁ ବହୁତ ଜାଗା ରେ ସାହାଯ୍ୟ କରିବ। ଉଦାହରଣ ସ୍ୱରୂପ, ଆମେ ଏହାକୁ ବ୍ୟବହାର କରି ବାତ୍ୟା କେବେ ଆସିବ ତାହା ଜାଣିପାରୁ, କିମ୍ବା କେଉଁ ରୋଗ କିପରି ହୁଏ ତାହା ଜାଣିପାରୁ। ଆମେ ତାକୁ ବ୍ୟବହାର କରି ଗୋଟିଏ ନୂଆ ଖେଳ ତିଆରି କରିପାରୁ, ଯାହା ବହୁତ ମଜାଦାର ହେବ।
ଏହି ଡାଟା ତିଆରି କରିବା ଓ ତାକୁ ମଡେଲରେ ବ୍ୟବହାର କରିବା ଏକ ଆଶ୍ଚର୍ଯ୍ୟଜନକ ଜିନିଷ। AWS Clean Rooms ଆମକୁ ଏହାକୁ ସୁରକ୍ଷିତ ଭାବରେ କରିବାକୁ ସାହାଯ୍ୟ କରେ। ଏବେ Incremental Training ଓ Distributed Training ସହ ଏହା ଆହୁରି ମଜାଦାର ଓ ଶକ୍ତିଶାଳୀ ହୋଇଯାଇଛି।
ଯଦି ତୁମେ ବିଜ୍ଞାନକୁ ଭଲ ପାଉଛ, ତାହେଲେ ଏହି ନୂଆ ଜିନିଷ ଗୁଡିକ ତୁମକୁ ଏଥିରେ ଆହୁରି ଅଧିକ ଆଗ୍ରହୀ କରିବ। ତୁମେ ନିଜେ ବି ଏହିଭଳି ମଜାଦାର ମଡେଲ ତିଆରି କରିପାରିବ! କେବଳ ଡାଟା ତିଆରି କର, ଶିଖୁଥାଅ ଏବଂ ନୂଆ ଜିନିଷ ତିଆରି କର!
AWS Clean Rooms supports incremental and distributed training for custom modeling
ଏଆଇ ସମ୍ବାଦ ଦେଇଛି।
Google Gemini ରୁ ଉତ୍ତର ପାଇଁ ନିମ୍ନଲିଖିତ ପ୍ରଶ୍ନ ବ୍ୟବହାର କରାଯାଇଛି:
2025-07-01 21:55 ରେ, Amazon ‘AWS Clean Rooms supports incremental and distributed training for custom modeling’ ପ୍ରକାଶ କରିଛନ୍ତି। ଦୟାକରି ସମ୍ବନ୍ଧିତ ସୂଚନା ସହ ଏକ ବିସ୍ତୃତ ଲେଖା ଲେଖନ୍ତୁ, ଯାହା ପିଲା ଏବଂ ଛାତ୍ରମାନେ ବୁଝିପାରିବେ ଏବଂ ଅଧିକ ପିଲାଙ୍କୁ ବିଜ୍ଞାନରେ ଆଗ୍ରହୀ କରିବ। ଦୟାକରି କେବଳ ଓଡ଼ିଆରେ ଲେଖା ପ୍ରଦାନ କରନ୍ତୁ।