"Learning"的相关文档 - 文库宝

开通VIP限时优惠

|

登录 | 注册

标签“Learning”的相关文档，共905条

Sample Efficient Reinforcement Learning In Continuous State Spaces A Perspective Beyond Linearity
SampleEfﬁcientReinforcementLearningInContinuousStateSpaces:APerspectiveBeyondLinearityDhruvMalik1AldoPacchiano2VishwakSrinivasan1YuanzhiLi1Abstractsuchabenchmark(Bellemareetal.,2013).Agentstrained...
Learning Efficient Reinforcement in Sample
2023-11-16 19:41:391096382.37 KB4
下载文档
Safe Reinforcement Learning with Linear Function Approximation
SafeReinforcementLearningwithLinearFunctionApproximationSanaeAmani1ChristosThrampoulidis2LinF.Yang1Abstractactionmayleadtocatastrophicresults.Thus,safetyinRLhasbecomeaseriousissuethatrestrictstheap...
Learning Approximation with Reinforcement Linear
2023-11-16 19:41:391097663.7 KB15
下载文档
Safe Reinforcement Learning Using Advantage-Based Intervention
SafeReinforcementLearningUsingAdvantage-BasedInterventionNolanWagener1ByronBoots2Ching-AnCheng3AbstractFigure1.Advantage-basedinterventionofSAILRandconstruc-tionofthesurrogateMDPM.InM,wheneverthepo...
Learning Using Reinforcement Safe Intervention
2023-11-16 19:41:391814907.47 KB24
下载文档
RRL Resnet as representation for Reinforcement Learning
RRL:ResnetasrepresentationforReinforcementLearningRutavShah1VikashKumar2AbstractSupervisedLearningTheabilitytoautonomouslylearnbehaviorsviaReinforcementdirectinteractionsinuninstrumentedenviron-Lea...
Learning for Reinforcement Representation as
2023-11-16 19:41:396437.08 MB19
下载文档
Robust Unsupervised Learning via L-statistic Minimization
RobustUnsupervisedLearningviaL-StatisticMinimizationAndreasMaurer1DanielaA.Parletta12AndreaPaudice13MassimilanoPontil14Abstractrestrictattentionto“asufﬁcientportionofthedataingoodagreementwithone...
Learning Unsupervised via Robust Minimization
2023-11-16 19:41:387451002.34 KB5
下载文档
Robust Representation Learning via Perceptual Similarity Metrics
RobustRepresentationLearningviaPerceptualSimilarityMetricsSaeidAsgariTaghanaki1KristyChoi2AmirKhasahmadi1AnirudhGoyal3Abstractofdeepneuralnetworks(Deanetal.,2012;LeCunetal.,2015)havebeenpivotaltowa...
Learning via Robust Representation Similarity
2023-11-16 19:41:387486.53 MB14
下载文档
Robust Reinforcement Learning using Least Squares Policy Iteration with Provable Performance Guarantees
RobustReinforcementLearningusingLeastSquaresPolicyIterationwithProvablePerformanceGuaranteesKishanPanaganti1DileepKalathil1AbstractThismismatchbetweenthetrainingandtestingenvironmentparameterscansi...
Learning Using Reinforcement Robust Policy
2023-11-16 19:41:3814352.55 MB14
下载文档
Robust Learning for Data Poisoning Attacks
RobustLearningforDataPoisoningAttacksYunjuanWang1PooryaMianjy1RamanArora1Abstractinsettingswhereanadversarycanaffectanypartofthetrainingdata.Therefore,inthispaper,weareinterestedinWeinvestigatether...
Learning for Data Robust Attacks
2023-11-16 19:41:378052.78 MB16
下载文档
Robust Asymmetric Learning in POMDPs
RobustAsymmetricLearninginPOMDPsAndrewWarrington1J.WilderLavington23AdamS´cibior23MarkSchmidt24FrankWood235Abstracttheworld,tocompletethetask.Atrainee,observingonlyimages,canthenlearntomimictheact...
Learning Asymmetric Robust in POMDPs
2023-11-16 19:41:3612352.46 MB9
下载文档
Risk-Sensitive Reinforcement Learning with Function Approximation A Debiasing Approach
Risk-SensitiveReinforcementLearningwithFunctionApproximation:ADebiasingApproachYingjieFei1ZhuoranYang2ZhaoranWang1Abstractrisk-seekingobjectiveandβ<0inducesarisk-averseone.ItcanalsobeseenthatVβte...
Learning Approximation with Reinforcement Function
2023-11-16 19:41:35673326.21 KB4
下载文档
Reward Identification in Inverse Reinforcement Learning
RewardIdentiﬁcationinInverseReinforcementLearningKunoKim1KirankumarShiragur1ShivamGarg1StefanoErmon1AbstractMDPstobuildcomputationalmodels(Niv,2009)ofreal-world,rationaldecisionmakerssuchasinvesto...
Learning Identification Reinforcement in Inverse
2023-11-16 19:41:34826707.94 KB14
下载文档
Revisiting Peng’s Q($λ$) for Modern Reinforcement Learning
RevisitingPeng’sQ(λ)forModernReinforcementLearningTadashiKozuno1YunhaoTang2MarkRowland3Re´miMunos4StevenKapturowski3WillDabney3MichalValko4DavidAbel3Abstract1996;Watkins,1989;Peng&Williams,1994;...
Learning for Reinforcement Modern Revisiting
2023-11-16 19:41:3310933.25 MB10
下载文档
REPAINT Knowledge Transfer in Deep Reinforcement Learning
REPAINT:KnowledgeTransferinDeepReinforcementLearningYunzheTao1SahikaGenc1JonathanChung1TaoSun1SunilMallya1Abstractimproveperformanceonothertasks.AcceleratingLearningprocessesforcomplextasksTransfer...
Learning Reinforcement Deep in Transfer
2023-11-16 19:41:3112275.59 MB16
下载文档
Reinforcement Learning with Prototypical Representations
ReinforcementLearningwithPrototypicalRepresentationsDenisYarats12RobFergus1AlessandroLazaric2LerrelPinto1Abstractfromrewardsaloneissampleinefﬁcientandleadstopoorperformance.Priorwork(Srinivasetal....
Learning Representations with Reinforcement Prototypical
2023-11-16 19:41:3111422.51 MB7
下载文档
Reinforcement Learning Under Moral Uncertainty
ReinforcementLearningUnderMoralUncertaintyAdrienEcoffet12JoelLehman12AbstractWhilesuchaccomplishmentsaresigniﬁcant,progresshasbeenlessstraight-forwardinapplyingRLtounstructuredAnambitiousgoalforma...
Learning Reinforcement under Uncertainty Moral
2023-11-16 19:41:301796361.6 KB18
下载文档
Reinforcement Learning of Implicit and Explicit Control Flow Instructions
ReinforcementLearningofImplicitandExplicitControlFlowinInstructionsEthanA.Brooks1JanarthananRajendran1RichardL.Lewis2SatinderSingh1Abstracttaskinstructionsthatrequiretheagenttolearncontrolﬂoweithe...
Learning of and Reinforcement Control
2023-11-16 19:41:309611.55 MB14
下载文档
Reinforcement Learning for Cost-Aware Markov Decision Processes
ReinforcementLearningforCost-AwareMarkovDecisionProcessesWesleyA.Suttle1KaiqingZhang2ZhuoranYang3DavidN.Kraemer1JiLiu4Abstractquentlyusedinpractice.Nevertheless,alternativeobjectiveshaveseenincreas...
Learning for Reinforcement Markov Decision
2023-11-16 19:41:301655528.56 KB18
下载文档
Zeroth-Order Non-Convex Learning via Hierarchical Dual Averaging
Zeroth-OrderNon-ConvexLearningviaHierarchicalDualAveragingAmélieHéliou1MatthieuMartin1PanayotisMertikopoulos21ThibaudRahier1Abstractalsorequiresthattheproblem’sobjectiveremainstationaryduringthe...
Learning via Hierarchical Dual Non-convex
2023-11-16 19:41:28660401.59 KB8
下载文档
World Model as a Graph Learning Latent Landmarks for Planning
WorldModelasaGraph:LearningLatentLandmarksforPlanningLunjunZhang12GeYang3BradlyStadie4Abstract1.IntroductionPlanning,theabilitytoanalyzethestructureofaAnintelligentagentshouldbeabletosolvedifﬁcult...
Learning Model Graph Latent as
2023-11-16 19:41:2713163.41 MB11
下载文档
Whitening for Self-Supervised Representation Learning
WhiteningforSelf-SupervisedRepresentationLearningAleksandrErmolov1AliaksandrSiarohin1EnverSangineto1NicuSebe1Abstractofwordsinasentenceisusedtolearnalanguagemodel(Mikolovetal.,2013a;b;Devlinetal.,2...
Learning for Self-supervised Representation Whitening
2023-11-16 19:41:278601.46 MB16
下载文档

首页上页 1 2 3 4 5 下页尾页

确认删除?

VIP会员服务
限时5折优惠