linkedin · lguo · Mar 11, 2020
diff --git a/.../integTest/scala/com/linkedin/photon/ml/normalization/NormalizationContextIntegTest.scala b/.../integTest/scala/com/linkedin/photon/ml/normalization/NormalizationContextIntegTest.scala
@@ -289,9 +289,9 @@ class NormalizationContextIntegTest extends SparkTestUtils with GameTestUtils {
 
     // Train the original data with a loss function binding normalization
     val zero = Vector.zeros[Double](heartDataRDD.first.features.length)
-    val (model1, objective1) = optimizerNorm.optimize(objectiveFunction, zero)(heartDataRDD)
+    val (model1, _, objective1) = optimizerNorm.optimize(objectiveFunction, zero)(heartDataRDD)
     // Train the transformed data with a normal loss function
-    val (model2, objective2) = optimizerNoNorm.optimize(objectiveFunction, zero)(transformedRDD)
+    val (model2, _, objective2) = optimizerNoNorm.optimize(objectiveFunction, zero)(transformedRDD)
 
     heartDataRDD.unpersist()
     transformedRDD.unpersist()

diff --git a/photon-api/src/integTest/scala/com/linkedin/photon/ml/supervised/BaseGLMIntegTest.scala b/photon-api/src/integTest/scala/com/linkedin/photon/ml/supervised/BaseGLMIntegTest.scala
@@ -182,21 +182,20 @@ class BaseGLMIntegTest extends SparkTestUtils {
     val optimizationProblem = optimizationProblemBuilder(normalizationContext)
 
     // Step 2: Run optimization
-    val models = BaseGLMIntegTest.LAMBDAS.map { lambda =>
+    val modelsAndStateTrackers = BaseGLMIntegTest.LAMBDAS.map { lambda =>
       optimizationProblem.updateRegularizationWeight(lambda)
-      val result = optimizationProblem.run(trainingSet)
-      val statesTracker = optimizationProblem.getStatesTracker
+      val (model, statesTracker) = optimizationProblem.run(trainingSet)
 
       // Step 3: Check convergence
       BaseGLMIntegTest.checkConvergence(statesTracker)
 
-      result
+      (model, statesTracker)
     }
 
     // Step 4: Validate the models
-    models.foreach( m => {
-      m.validateCoefficients()
-      validator.validateModelPredictions(m, trainingSet)
+    modelsAndStateTrackers.foreach( t => {
+      t._1.validateCoefficients()
+      validator.validateModelPredictions(t._1, trainingSet)
     })
   }
 }

diff --git a/photon-api/src/main/scala/com/linkedin/photon/ml/ModelTraining.scala b/photon-api/src/main/scala/com/linkedin/photon/ml/ModelTraining.scala
@@ -184,7 +184,7 @@ object ModelTraining extends Logging {
           // Initialize the list with the result from the first regularization weight
           optimizationProblem.updateRegularizationWeight(currentWeight)
 
-          val glm = if (numWarmStartModels == 0) {
+          val (glm, stateTracker) = if (numWarmStartModels == 0) {
 
             logger.info(s"No warm start model found; beginning training with a 0-coefficients model")
 
@@ -199,14 +199,14 @@ object ModelTraining extends Logging {
             optimizationProblem.run(trainingData, warmStartModels(maxLambda))
           }
 
-          List((currentWeight, glm, optimizationProblem.getStatesTracker))
+          List((currentWeight, glm, stateTracker))
 
         case (latestWeightsModelsAndTrackers, currentWeight) =>
 
           optimizationProblem.updateRegularizationWeight(currentWeight)
 
           // Train the rest of the models
-          val glm = if (useWarmStart) {
+          val (glm, stateTracker) = if (useWarmStart) {
             val previousModel = latestWeightsModelsAndTrackers.head._2
 
             logger.info(s"Training model with regularization weight $currentWeight started (warm start)")
@@ -219,7 +219,7 @@ object ModelTraining extends Logging {
             optimizationProblem.run(trainingData)
           }
 
-          (currentWeight, glm, optimizationProblem.getStatesTracker) +: latestWeightsModelsAndTrackers
+          (currentWeight, glm, stateTracker) +: latestWeightsModelsAndTrackers
       }
 
     broadcastNormalizationContext.unpersist()

diff --git a/photon-api/src/main/scala/com/linkedin/photon/ml/algorithm/FixedEffectCoordinate.scala b/photon-api/src/main/scala/com/linkedin/photon/ml/algorithm/FixedEffectCoordinate.scala
@@ -123,9 +123,10 @@ object FixedEffectCoordinate {
 
     val newModel = initialFixedEffectModelOpt
       .map { initialFixedEffectModel =>
-        optimizationProblem.runWithSampling(input, initialFixedEffectModel.model)
+        val (model, _) = optimizationProblem.runWithSampling(input, initialFixedEffectModel.model)
+        model
       }
-      .getOrElse(optimizationProblem.runWithSampling(input))
+      .getOrElse(optimizationProblem.runWithSampling(input)._1)
     val updatedModelBroadcast = input.sparkContext.broadcast(newModel)
 
     new FixedEffectModel(updatedModelBroadcast, featureShardId)

diff --git a/photon-api/src/main/scala/com/linkedin/photon/ml/algorithm/RandomEffectCoordinate.scala b/photon-api/src/main/scala/com/linkedin/photon/ml/algorithm/RandomEffectCoordinate.scala
@@ -15,7 +15,6 @@
 package com.linkedin.photon.ml.algorithm
 
 import org.apache.spark.SparkContext
-import org.apache.spark.rdd.RDD
 import org.apache.spark.storage.StorageLevel
 
 import com.linkedin.photon.ml.data._
@@ -246,8 +245,7 @@ object RandomEffectCoordinate {
           .mapValues {
             case (Some(localModel), Some((localDataset, optimizationProblem))) =>
               val trainingLabeledPoints = localDataset.dataPoints.map(_._2)
-              val updatedModel = optimizationProblem.run(trainingLabeledPoints, localModel)
-              val stateTrackers = optimizationProblem.getStatesTracker
+              val (updatedModel, stateTrackers) = optimizationProblem.run(trainingLabeledPoints, localModel)
 
               (updatedModel, Some(stateTrackers))
 
@@ -256,8 +254,7 @@ object RandomEffectCoordinate {
 
             case (None, Some((localDataset, optimizationProblem))) =>
               val trainingLabeledPoints = localDataset.dataPoints.map(_._2)
-              val updatedModel = optimizationProblem.run(trainingLabeledPoints)
-              val stateTrackers = optimizationProblem.getStatesTracker
+              val (updatedModel,stateTrackers) = optimizationProblem.run(trainingLabeledPoints)
 
               (updatedModel, Some(stateTrackers))
 
@@ -274,10 +271,9 @@ object RandomEffectCoordinate {
       .getOrElse {
         val modelsAndTrackers = dataAndOptimizationProblems.mapValues { case (localDataset, optimizationProblem) =>
           val trainingLabeledPoints = localDataset.dataPoints.map(_._2)
-          val newModel = optimizationProblem.run(trainingLabeledPoints)
-          val stateTrackers = optimizationProblem.getStatesTracker
+          val (model, stateTrackers) = optimizationProblem.run(trainingLabeledPoints)
 
-          (newModel, stateTrackers)
+          (model, stateTrackers)
         }
         modelsAndTrackers.persist(StorageLevel.MEMORY_ONLY_SER)
 

diff --git a/...i/src/main/scala/com/linkedin/photon/ml/optimization/DistributedOptimizationProblem.scala b/...i/src/main/scala/com/linkedin/photon/ml/optimization/DistributedOptimizationProblem.scala
@@ -14,7 +14,7 @@
  */
 package com.linkedin.photon.ml.optimization
 
-import breeze.linalg.{Vector, cholesky, diag}
+import breeze.linalg.{cholesky, diag, Vector}
 import org.apache.spark.rdd.RDD
 import org.apache.spark.storage.StorageLevel
 
@@ -109,8 +109,9 @@ protected[ml] class DistributedOptimizationProblem[Objective <: DistributedObjec
    * @param input The training data
    * @return The learned [[GeneralizedLinearModel]]
    */
-  override def run(input: RDD[LabeledPoint]): GeneralizedLinearModel =
+  override def run(input: RDD[LabeledPoint]): (GeneralizedLinearModel, OptimizationStatesTracker) = {
     run(input, initializeZeroModel(input.first.features.size))
+  }
 
   /**
    * Run the algorithm with the configured parameters, starting from the initial model provided
@@ -120,13 +121,13 @@ protected[ml] class DistributedOptimizationProblem[Objective <: DistributedObjec
    * @param initialModel The initial model from which to begin optimization
    * @return The learned [[GeneralizedLinearModel]]
    */
-  override def run(input: RDD[LabeledPoint], initialModel: GeneralizedLinearModel): GeneralizedLinearModel = {
+  override def run(input: RDD[LabeledPoint], initialModel: GeneralizedLinearModel): (GeneralizedLinearModel, OptimizationStatesTracker) = {
 
     val normalizationContext = optimizer.getNormalizationContext
-    val (optimizedCoefficients, _) = optimizer.optimize(objectiveFunction, initialModel.coefficients.means)(input)
+    val (optimizedCoefficients, stateTracker, _) = optimizer.optimize(objectiveFunction, initialModel.coefficients.means)(input)
     val optimizedVariances = computeVariances(input, optimizedCoefficients)
 
-    createModel(normalizationContext, optimizedCoefficients, optimizedVariances)
+    (createModel(normalizationContext, optimizedCoefficients, optimizedVariances), stateTracker)
   }
 
   /**
@@ -136,7 +137,7 @@ protected[ml] class DistributedOptimizationProblem[Objective <: DistributedObjec
    * @param input The training data
    * @return The learned [[GeneralizedLinearModel]]
    */
-  def runWithSampling(input: RDD[(UniqueSampleId, LabeledPoint)]): GeneralizedLinearModel =
+  def runWithSampling(input: RDD[(UniqueSampleId, LabeledPoint)]): (GeneralizedLinearModel, OptimizationStatesTracker) =
     runWithSampling(input, initializeZeroModel(input.first._2.features.size))
 
   /**
@@ -149,19 +150,19 @@ protected[ml] class DistributedOptimizationProblem[Objective <: DistributedObjec
    */
   def runWithSampling(
       input: RDD[(UniqueSampleId, LabeledPoint)],
-      initialModel: GeneralizedLinearModel): GeneralizedLinearModel = {
+      initialModel: GeneralizedLinearModel): (GeneralizedLinearModel, OptimizationStatesTracker) = {
 
     val data = (samplerOption match {
         case Some(sampler) => sampler.downSample(input).values
         case None => input.values
       })
       .setName("In memory fixed effect training dataset")
       .persist(StorageLevel.MEMORY_AND_DISK)
-    val result = run(data, initialModel)
+    val (model, stateTracker) = run(data, initialModel)
 
     data.unpersist()
 
-    result
+    (model, stateTracker)
   }
 }
 

diff --git a/...main/scala/com/linkedin/photon/ml/optimization/GeneralizedLinearOptimizationProblem.scala b/...main/scala/com/linkedin/photon/ml/optimization/GeneralizedLinearOptimizationProblem.scala
@@ -98,7 +98,7 @@ protected[ml] abstract class GeneralizedLinearOptimizationProblem[Objective <: O
    * @param input The training data
    * @return The learned GLM for the given optimization problem, data, regularization type, and regularization weight
    */
-  def run(input: objectiveFunction.Data): GeneralizedLinearModel
+  def run(input: objectiveFunction.Data): (GeneralizedLinearModel, OptimizationStatesTracker)
 
   /**
    * Run the optimization algorithm on the input data, starting from the initial model provided.
@@ -107,7 +107,7 @@ protected[ml] abstract class GeneralizedLinearOptimizationProblem[Objective <: O
    * @param initialModel The initial model from which to begin optimization
    * @return The learned GLM for the given optimization problem, data, regularization type, and regularization weight
    */
-  def run(input: objectiveFunction.Data, initialModel: GeneralizedLinearModel): GeneralizedLinearModel
+  def run(input: objectiveFunction.Data, initialModel: GeneralizedLinearModel): (GeneralizedLinearModel, OptimizationStatesTracker)
 
   /**
    * Compute the regularization term value

diff --git a/...pi/src/main/scala/com/linkedin/photon/ml/optimization/SingleNodeOptimizationProblem.scala b/...pi/src/main/scala/com/linkedin/photon/ml/optimization/SingleNodeOptimizationProblem.scala
@@ -77,7 +77,7 @@ protected[ml] class SingleNodeOptimizationProblem[Objective <: SingleNodeObjecti
    * @param input The training data
    * @return The learned GLM for the given optimization problem, data, regularization type, and regularization weight
    */
-  override def run(input: Iterable[LabeledPoint]): GeneralizedLinearModel =
+  override def run(input: Iterable[LabeledPoint]): (GeneralizedLinearModel, OptimizationStatesTracker) =
     run(input, initializeZeroModel(input.head.features.size))
 
   /**
@@ -87,13 +87,13 @@ protected[ml] class SingleNodeOptimizationProblem[Objective <: SingleNodeObjecti
    * @param initialModel The initial model from which to begin optimization
    * @return The learned GLM for the given optimization problem, data, regularization type, and regularization weight
    */
-  override def run(input: Iterable[LabeledPoint], initialModel: GeneralizedLinearModel): GeneralizedLinearModel = {
+  override def run(input: Iterable[LabeledPoint], initialModel: GeneralizedLinearModel): (GeneralizedLinearModel, OptimizationStatesTracker) = {
 
     val normalizationContext = optimizer.getNormalizationContext
-    val (optimizedCoefficients, _) = optimizer.optimize(objectiveFunction, initialModel.coefficients.means)(input)
+    val (optimizedCoefficients, stateTracker, _) = optimizer.optimize(objectiveFunction, initialModel.coefficients.means)(input)
     val optimizedVariances = computeVariances(input, optimizedCoefficients)
 
-    createModel(normalizationContext, optimizedCoefficients, optimizedVariances)
+    (createModel(normalizationContext, optimizedCoefficients, optimizedVariances), stateTracker)
   }
 }
 

diff --git a/photon-api/src/test/scala/com/linkedin/photon/ml/algorithm/FixedEffectCoordinateTest.scala b/photon-api/src/test/scala/com/linkedin/photon/ml/algorithm/FixedEffectCoordinateTest.scala
@@ -110,12 +110,12 @@ class FixedEffectCoordinateTest {
       case Some(initialModel) =>
         val rawModel = initialModel.model
 
-        doReturn(updatedModel).when(optimizationProblem).runWithSampling(labeledPoints, rawModel)
+        doReturn((updatedModel, statesTracker)).when(optimizationProblem).runWithSampling(labeledPoints, rawModel)
 
         coordinate.trainModel(initialModel)
 
       case None =>
-        doReturn(updatedModel).when(optimizationProblem).runWithSampling(labeledPoints)
+        doReturn((updatedModel, statesTracker)).when(optimizationProblem).runWithSampling(labeledPoints)
 
         coordinate.trainModel()
     }

diff --git a/...c/test/scala/com/linkedin/photon/ml/optimization/DistributedOptimizationProblemTest.scala b/...c/test/scala/com/linkedin/photon/ml/optimization/DistributedOptimizationProblemTest.scala
@@ -139,9 +139,8 @@ class DistributedOptimizationProblemTest {
     doReturn(broadcastCoefficients).when(sparkContext).broadcast(means)
     doReturn(broadcastNormalization).when(optimizer).getNormalizationContext
     doReturn(normalization).when(broadcastNormalization).value
-    doReturn((means, None)).when(optimizer).optimize(objectiveFunction, means)(trainingData)
-    doReturn(statesTracker).when(optimizer).getStateTracker
-    doReturn(Array(state)).when(statesTracker).getTrackedStates
+    doReturn((means, statesTracker, None)).when(optimizer).optimize(objectiveFunction, means)(trainingData)
+     doReturn(Array(state)).when(statesTracker).getTrackedStates
     doReturn(means).when(state).coefficients
     doReturn(coefficients).when(initialModel).coefficients
     doReturn(means).when(coefficients).means
@@ -154,7 +153,7 @@ class DistributedOptimizationProblemTest {
       NoRegularizationContext,
       VarianceComputationType.NONE)
 
-    val model = problem.run(trainingData, initialModel)
+    val (model, _) = problem.run(trainingData, initialModel)
 
     assertTrue(means.eq(model.coefficients.means))
   }

diff --git a/.../scala/com/linkedin/photon/ml/optimization/GeneralizedLinearOptimizationProblemTest.scala b/.../scala/com/linkedin/photon/ml/optimization/GeneralizedLinearOptimizationProblemTest.scala
@@ -213,6 +213,7 @@ object GeneralizedLinearOptimizationProblemTest {
       VarianceComputationType.NONE) {
 
     private val mockGLM = mock(classOf[GeneralizedLinearModel])
+    private val mockStateTracker = mock(classOf[OptimizationStatesTracker])
 
     //
     // Public versions of protected methods for testing
@@ -242,13 +243,13 @@ object GeneralizedLinearOptimizationProblemTest {
     /**
      * Unused - needs definition for testing.
      */
-    override def run(input: Iterable[LabeledPoint]): GeneralizedLinearModel = mockGLM
+    override def run(input: Iterable[LabeledPoint]): (GeneralizedLinearModel, OptimizationStatesTracker) = (mockGLM, mockStateTracker)
 
     /**
      * Unused - needs definition for testing.
      */
-    override def run(input: Iterable[LabeledPoint], initialModel: GeneralizedLinearModel): GeneralizedLinearModel =
-      mockGLM
+    override def run(input: Iterable[LabeledPoint], initialModel: GeneralizedLinearModel): (GeneralizedLinearModel, OptimizationStatesTracker) =
+      (mockGLM, mockStateTracker)
   }
 
   // No way to pass Mixin class type to Mockito, need to define a concrete class

diff --git a/...rc/test/scala/com/linkedin/photon/ml/optimization/SingleNodeOptimizationProblemTest.scala b/...rc/test/scala/com/linkedin/photon/ml/optimization/SingleNodeOptimizationProblemTest.scala
@@ -123,8 +123,7 @@ class SingleNodeOptimizationProblemTest {
 
     doReturn(broadcastNormalization).when(optimizer).getNormalizationContext
     doReturn(normalization).when(broadcastNormalization).value
-    doReturn((means, None)).when(optimizer).optimize(objectiveFunction, means)(trainingData)
-    doReturn(statesTracker).when(optimizer).getStateTracker
+    doReturn((means, statesTracker, None)).when(optimizer).optimize(objectiveFunction, means)(trainingData)
     doReturn(Array(state)).when(statesTracker).getTrackedStates
     doReturn(means).when(state).coefficients
     doReturn(coefficients).when(initialModel).coefficients
@@ -136,7 +135,7 @@ class SingleNodeOptimizationProblemTest {
       LogisticRegressionModel.apply,
       VarianceComputationType.NONE)
 
-    val model = problem.run(trainingData, initialModel)
+    val (model, _) = problem.run(trainingData, initialModel)
 
     assertTrue(means.eq(model.coefficients.means))
   }

diff --git a/photon-lib/src/main/scala/com/linkedin/photon/ml/optimization/Optimizer.scala b/photon-lib/src/main/scala/com/linkedin/photon/ml/optimization/Optimizer.scala
@@ -162,7 +162,7 @@ abstract class Optimizer[-Function <: ObjectiveFunction](
   protected[ml] def optimize(
       objectiveFunction: Function,
       initialCoefficients: Vector[Double])(
-      data: objectiveFunction.Data): (Vector[Double], Double) = {
+      data: objectiveFunction.Data): (Vector[Double], OptimizationStatesTracker, Double) = {
 
     val normalizedInitialCoefficients = normalizationContext.value.modelToTransformedSpace(initialCoefficients)
 
@@ -183,7 +183,7 @@ abstract class Optimizer[-Function <: ObjectiveFunction](
 
     statesTracker.convergenceReason = getConvergenceReason
     val currState = getCurrentState.get
-    (currState.coefficients, currState.loss)
+    (currState.coefficients, statesTracker, currState.loss)
   }
 
   /**

diff --git a/photon-lib/src/test/scala/com/linkedin/photon/ml/optimization/LBFGSBTest.scala b/photon-lib/src/test/scala/com/linkedin/photon/ml/optimization/LBFGSBTest.scala
@@ -63,7 +63,7 @@ class LBFGSBTest {
         (lowerBounds(pos) + upperBounds(pos)) / 2
       }
       .toArray
-    val (actualCoef, actualValue) = lbfgsb.optimize(objective, DenseVector[Double](initialCoefficients))(trainingData)
+    val (actualCoef, _, actualValue) = lbfgsb.optimize(objective, DenseVector[Double](initialCoefficients))(trainingData)
 
     Assertions.assertIterableEqualsWithTolerance(actualCoef.toArray, expectedCoef, LBFGSBTest.EPSILON)
     assertEquals(actualValue, expectedValue, LBFGSBTest.EPSILON)

diff --git a/photon-lib/src/test/scala/com/linkedin/photon/ml/optimization/LBFGSTest.scala b/photon-lib/src/test/scala/com/linkedin/photon/ml/optimization/LBFGSTest.scala
@@ -47,7 +47,7 @@ class LBFGSTest {
     val objective = new TestObjective
     val trainingData = Array(LabeledPoint(0.0, CommonTestUtils.generateDenseVector(1), 0.0, 0.0))
     val initialCoefficients = CommonTestUtils.generateDenseVector(1)
-    val (actualCoef, actualValue) = lbfgs.optimize(objective, initialCoefficients)(trainingData)
+    val (actualCoef, _, actualValue) = lbfgs.optimize(objective, initialCoefficients)(trainingData)
 
     Assertions.assertIterableEqualsWithTolerance(actualCoef.toArray, Array(TestObjective.CENTROID), LBFGSTest.EPSILON)
     assertEquals(actualValue, LBFGSTest.EXPECTED_LOSS, LBFGSTest.EPSILON)

diff --git a/photon-lib/src/test/scala/com/linkedin/photon/ml/optimization/OWLQNTest.scala b/photon-lib/src/test/scala/com/linkedin/photon/ml/optimization/OWLQNTest.scala
@@ -65,7 +65,7 @@ class OWLQNTest {
     val objective = new TestObjective
     val trainingData = Array(LabeledPoint(0.0, CommonTestUtils.generateDenseVector(expectedCoef.length), 0.0, 0.0))
     val initialCoefficients = CommonTestUtils.generateDenseVector(expectedCoef.length)
-    val (actualCoef, actualValue) = owlqn.optimize(objective, initialCoefficients)(trainingData)
+    val (actualCoef, _, actualValue) = owlqn.optimize(objective, initialCoefficients)(trainingData)
 
     Assertions.assertIterableEqualsWithTolerance(actualCoef.toArray, expectedCoef, OWLQNTest.EPSILON)
     Assert.assertEquals(actualValue, expectedValue, OWLQNTest.EPSILON)